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PREFACIO 


Policial, prenda este homem, 
ele fala em numeros 
Ele zune como uma geladeira, ele 
e como um radio fora do ar. 

(Radiohead, 1997) 

INTRODUQAO 

Os estudantes de ciencias sociais sempre 
desprezaram a Estatistica. Uma das razoes e 
que muitos nao entendem matematica, o que 
torna a compreensao de equagoes estatisticas 
complexas muito dificil. A maior vantagem 
em ter estudado estatistica no inicio dos anos 
de 1990 (como eu estudei) comparado com 
os anos de 1960 foi o desenvolvimento de 
softwares para fazer todo o trabalho. A vanta¬ 
gem em aprender estatistica hoje, comparado 
a dez anos atras, e que esses pacotes agora 
sao mais faceis de usar gramas ao Windows- 
MR /MacOS MR . O SPSS e, em minha opiniao, 
o melhor dos pacotes comerciais disponiveis, 
utilizado em muitas universidades. Entao, o 
que me levou a escrever um livro sobre esta¬ 
tistica e SPSS? 

Ja existem muitos bons livros que descre- 
vem a teoria estatistica. Howell (2002), Ste¬ 
vens (1992) e Wright (2002) escreveram livros 


maravilhosos e claros, mas utilizam exemplos 
de computador somente como um adendo a 
teoria. Da mesma maneira, existem muitos 
bons livros sobre SPSS (Kinnear e Gray, 2000; 
Foster, 2001), mas eles se concentram em “fa¬ 
zer os testes”. Usar SPSS sem conhecimento 
algum de estatistica pode ser perigoso (e so¬ 
mente uma ferramenta, nao um recurso divino 
dfiaft! Portanto, quero usar o SPSS 
como uma ferramenta para ensinar conceitos 
estatisticos. Agindo dessa maneira, espero que 
o leitor tenha um entendimento melhor, tanto 
da teoria quanto da pratica. 

Primeiro, quero responder o tipo de per- 
gunta que eu fazia quando estudava estatistica 
e usava o SPSS na faculdade (por exemplo, 
“Sera que consigo entender como funciona 
esse teste estatistico sem saber muito de ma¬ 
tematica?”, “O que este botao faz?”, “Mas que 
diabos significa esta saida?”). O SPSS tern um 
complexo conjunto de opcoes para cada teste, 
muitos dos quais sao ensinados de modo su¬ 
perficial por livros e professores. Espero ser 
capaz de explicar o que essas opcoes realmente 
fazem e por que voce deve usa-las. Quero ir 
alem de fornecer receitas. Muitos livros dizem 
ao leitor o que fazer (“aperte esta tecla”, “fa§a 
isso”, “faga aquilo”, etc.), e isso cria uma im- 
pressao de que a estatistica e o SPSS sao infle- 
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xfveis. O SPSS tem muitas opyoes projetadas 
que lhe permitem modificar um teste j a elabo- 
rado para seus fins espect'ficos. Portanto, em- 
bora eu fay a reccmendayoes, espero fornecer 
aos leitores fundamentos teoricos suficientes 
para torna-los capazes de tomar suas proprias 
decisoes sobre quais opyoes sao mais apropria- 
das para as analises que eles querem fazer. 

Meu segundo objetivo foi escrever um li- 
vro que pudesse ser lido por varios nfveis (veja 
a proxima seyao para mais detalhes). Existent 
capftulos para alunos do primeiro ano da fa- 
culdade (1, 2, 3, 4, 7 e 13), e capftulos para 
estudantes do segundo ano (5, 8, 9, 10, 11 e 
12) e capftulos de topicos mais avanyados que 
alunos pos-graduados poderao usar (6, 14, 15 
e 16). Todos esses capftulos devent ser acessf- 
veis a qualquer um e espero conseguir isso in- 
dicando o nfvel adequado de cada seyao (veja 
a proxima). 

0 QUE HA DE NOVO? 

Eu era muito ruim em matematica. Aos 
13 anos, era praticamente o ultimo da minha 
turrna. No entanto, 12 anos depois escrevi um 
livro-texto sobre estatfstica (e 17 anos depois 
terminei a segunda ediyao). A diferenya en- 
tre o menino de 13 anos que nao passou no 
seu exame e o de 15 anos que foi muito bem 
foi um bom professor: meu irmao, Paul. De 
fato, devo minha vida academica a habilidade 
de Paul em fazer o que meus professores nao 
fizeram: ensinar as materias de uma maneira 
envolvente. Ainda hoje ele aparece, quando 
necessario, para me ensinar coisas (um curso 
intensivo de programayao de computador, al- 
guns Natais atras, me vem a lembranya). De 
qualquer ntodo, a razao de ele ser um bom 
professor e que ele e capaz de tornar as coisas 
interessantes e relevantes para mim. Infeliz- 
mente, ele parece ter os genes de “bom pro¬ 
fessor” da famflia (e ele nem mesmo trabalha 
como professor, que desperdfcio!), mas eu te- 
nho tentado usar a sua abordagem nas minhas 
aulas e livros. Algo que aprendi foi que as 
pessoas apreciam um toque de humanidade, 
assim, na primeira ediyao, tentei colocar mui¬ 


to da minha personalidade (ou seria “falta de 
personalidade?”). Entao, havia alguns exem- 
plos despretensiosos (alguns disseram “inde- 
centes”, mas prefiro “despretensiosos”) e uma 
grande dose de humor - o que pode ter sido 
uma coisa ruim porque eu sou um professor e, 
portanto, nao tenho senso de humor! 

Quando escrevi a primeira ediyao, meu 
objetivo era escrever um tipo de livro de es¬ 
tatfstica que eu gostaria de ler. Muito egofsta, 
eu sei, mas achei que se eu tivesse um livro 
de referenda com exemplos que me divertis- 
sem, a vida se tornaria mais simples quando 
eu necessitasse de um livro para consulta. Nao 
achei que alguem fosse comprar a obra (bem, 
fora minha mae e meu pai) e eu antecipei des- 
culpas para comentarios do tipo “todo o capf- 
tulo X esta completamente errado e voce e um 
idiota”, ou “pense em quantas arvores morre- 
ram para este lixo ser escrito, voce deveria se 
envergonhar”. Na verdade, nem a editora pen- 
sou que o livro iria vender (eles revelaram isso 
posteriormente, devo acrescentar). Eu real- 
mente nao esperava receber rnuitos e-mails 
extremamente gentis de pessoas que gostaram 
do livro. Ate hoje ainda fico admirado que al¬ 
guem leia o livro e gaste tempo para me escre¬ 
ver um e-mail gentil (e devo acrescentar, com 
risco de parecer sentimental, que saber que o 
livro ajuda as pessoas faz com que o sorriso na 
minha face nunca desapareya). Mas por que 
estou contando tudo isso? Bem, vendo que 
pelo menos algumas pessoas apreciaram o es- 
tilo da primeira ediyao, tomei isto como uma 
luz verde para incluir mais exemplos estupi- 
dos, mais bobagens e mais mau gosto. Resu- 
mindo, muito mais sexo, drogas e rock ‘n' roll. 
Para todos aqueles que odeiam isso, desculpa, 
mas isso me diverte. 

Alem de acrescentar mais bobagens, fui 
foryado, com relutancia, a expandir o con- 
teudo academico. Muitos dos acrescimos sao 
resultados de alguem (geralmente muitas pes¬ 
soas) que me enviaram e-mails perguntando 
como fazer algo. Assim, teoricamente, esta 
ediyao deveria responder as perguntas que me 
foram feitas nos ultimos quatro anos! As mu- 
danyas gerais em cada capftulo sao: 
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• Exemplos: Cada capftulo agora tem mui- 
tos exemplos no final para voce trabalhar, 
incluindo as respostas. 

• Mais dados: Por causa dos exemplos, 
voce tem mais conjuntos de dados! 

• Relatando suas analises: Existem seizes 
sobre como relatar as analises na maioria 
dos capftulos. Essas seines foram basea- 
das no manual de estilo de publicagao da 
APA (American Psychological Associa¬ 
tion, 2001). 

• Glossario: Termos-chave estao agora 
identificados no texto e existe um glossa¬ 
rio de todos eles. 

• Tamanho de efeito: A maioria dos topi- 
cos agora tem uma discussao sobre como 
calcular o tamanho de efeito. 

• Resumos: Ha muita informagao no texto e 
meu estilo e divagador (prefiro “conversa- 
dor”), assim, existem agora quadras com 
resumo dos pontos-chave (veja a proxima 
segao sobre como usar este livro). 

• Quadros: Inumeros quadras que ressal- 
tam temas interessantes. 

• Sintaxe: Existe agora discussao sobre o 
uso da sintaxe do SPSS ao longo do livro. 

• SPSS 13: Embora essas fossem as me- 
nores mudangas, porque o SPSS 13 nao e 
muito diferente da versao 9, atualizei tudo 
com a ultima versao do SPSS. 

As mudangas especfficas de cada capftulo 

sao: 

• Capftulo 1 (Conceitos basicos): Foi ex¬ 
pandido para incluir mais fundamentos 
em teoria da estatfstica (por exemplo, 
intervalos de confianga, testes de signifi¬ 
cance, poder, tamanho de efeito). 

• Capftulo 2 (SPSS): Estava condensado 
dentro do Capftulo 1, mas foi atualizado 
para lidar com o SPSS 13 e agora inclui 
discussao da assustadora janela de sintaxe. 

• Capftulo 3 (Explorando dados): Tem 
alguma semelhanga com o antigo Capftu¬ 
lo 2 da primeira edigao. Ele agora aborda 
apresentagao de dados, transformagao de 
dados, verificagao de modelos de dados e 
muito mais. 


• Capftulo 4 (Correlagao): Estava no Ca¬ 
pftulo 3 e, na verdade, nao mudou muito. 

• Capftulo 5 (Regressao): Estava no Ca¬ 
pftulo 4 e agora tem um material mais 
avangado, como uma segao em previsores 
categoricos, bem como uma discussao 
de autovalores. Tambem expandi as se- 
goes originais de forma mais tecnica (por 
exemplo, uma discussao mais aprofunda- 
da do tamanho de efeito). 

• Capftulo 6 (Regressao Logfstica): O 
antigo Capftulo 5 foi aumentado leve- 
mente de varias formas (a parte teorica 
principalmente), mas tambem reorganizei 
alguns conteudos de modo que a teoria e 
as dicas do SPSS estao mais claramente 
separadas. 

• Capftulo 7 (Testes t): Nao foi alterado 
em relagao ao antigo Capftulo 6 exceto al- 
gumas informagoes das quais nao gostava 
que foram reescritas. 

• Capftulo 8 (MLG 1): E basicamente 
o mesmo antigo Capftulo 7, exceto que 
agora cobre as versoes de Welch e Brown- 
Forsythe da F quando a homogeneidade 
da variancia nao pode ser assumida. 

• Capftulo 9 (MLG 2): Aborda a analise de 
covariancia (ANCOVA), que antes dividia 
um capftulo com a ANOVA Fatorial, mas 
agora ganhou um capftulo proprio. Colo- 
quei algum material extra sobre contrastes 
planejados e corrigi alguns erros embara- 
gosos da primeira edigao.© 

• Capftulo 10 (MLG 3): Cobre ANOVA 
Fatorial (que dividia um capftulo com a 
ANCOVA). Existem segoes inteiramente 
novas sobre a teoria da ANOVA indepen- 
dente de dois fatores, como realizar con¬ 
trastes (com sintaxe), como realizar ana¬ 
lise de efeitos simples, interpretagao de 
diagramas de interagoes e como podemos 
conceitualizar a ANOVA de dois fatores 
como um MLG (Modelo Linear Genera- 
lizado). 

• Capftulo 11 (MLG 4): Era o Capftulo 
9 sobre a ANOVA de medidas repetidas. 
Adicionei uma segao sobre a teoria da 
ANOVA de medidas repetidas e sobre a 
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condugao de analises de efeitos simples 
na ANOVA de medidas repetidas com 
dois fatores. 

• Capi'tulo 12 (MLG 5): Aborda a ANO- 
VA mista (estava junto com ANOVA de 
medidas repetidas no antigo Capftulo 9). 
Existe um exemplo completamente novo 
e, com o novo capftulo, expandi um pou- 
co as segoes de interpretacao. 

• Capftulo 13 (Estatistica nao-parame- 
trica): E um capftulo completamente 
novo (embora pegue emprestadas algu- 
mas coisas do Capftulo 2). Acrescentei 
segoes de teoria para os testes de Mann- 
Whitney e Wilcoxon; tambem acrescen¬ 
tei segoes completamente novas que co- 
brem a ANOVA de Friedman, o teste de 
Jonckheere e o teste de Kruskal-Wallis. 

• Capftulo 14: (MANOVA): Nao mudou 
muito do Capftulo 10. 

• Capftulo 15 (Analise de fatores): Reor- 
ganizei o material para que o que estava 
escondido na segao de interpretacao ficas- 
se agora claramente colocado na segao de 
teoria. E uma segao completamente nova 
sobre analise de confiabilidade. 

• Capftulo 16 (Dados categoricos): E ba- 
sicamente um capftulo novo (embora o 
exemplo do qui-quadrado seja antigo). 
Incluf uma segao de teoria para o teste 
qui-quadrado, razao de verossimilhanga e 
corregao de Yates, discussao sobre razao 


de chances (odds ratios ) e analise Logli- 
near. Nenhuma dessas segbes estava na 
antiga edigao! 

ADEUS 

Escrevi no infcio da primeira edigao que 
“este livro e o resultado de dois anos (com 
uma ou duas semanas para escrever a minha 
tese de doutorado) tentando atingir esses ob- 
jetivos. Ele nao e perfeito, e eu gostaria de ter 
um retorno (bom ou ruim) das pessoas que 
realmente contam: voces, os leitores”. Esse 
sentimento ainda se aplica, exceto que agora 
e o resultado de dois anos e meio de trabalho. 
Ao longo desses ultimos quatro anos, fiquei 
muito ligado a este livro: ele comegou com um 
trabalho de amor e ainda e. Com o inesperado 
sucesso da primeira edigao, e, tendo feito mui- 
tas atualizagoes para a segunda edigao (trezen- 
tas paginas comparadas com as cinquenta pa- 
ginas que a editora queria que eu escrevesse!), 
estou muito preocupado que eu tenha mudado 
tudo! Portanto, embora eu nao saiba se o livro 
tera uma terceira edigao, mesmo assim, gosta¬ 
ria de ter o retorno das pessoas que realmente 
contam: voces, os leitores. 

Andy 

E-mail : discoveringstatistics@sussex.ac.uk 
Web\ http/www.sussex.ac.uk./Users/andyf/ 



COMO USAR ESTE UVRO 


Quando a editora me pediu para escre- 
ver uma segao sobre “como usar este livro” 
foi tentador escrever “compre um frasco de 
creme antirrugas (o que voce ira precisar para 
se defender dos efeitos do envelhecimento 
enquanto ler o livro), procure uma cadeira 
confortavel, sente, dobre a capa, comece a 
ler e so pare quando chegar a ultima pagina”. 
Entretanto, acho que eles gostariam de algo 
mais util.© 

QUE CONHECIMENTO ANTERIOR VOCE 
PRECISA TER? 

Baseei-me na suposigao de que voce nao 
sabe nada sobre estatfstica, mas tem algum co- 
nhecimento basico sobre computador (eu nao 
vou dizer como liga-lo, por exemplo) e mate- 
matica (embora eu tenha incluldo uma revisao 
rapida sobre alguns conceitos basicos, assim, eu 
nao suponho nenhum conhecimento previo). 

OS CAPITULOS FICAM MAIS DIFICEIS 
AO LONGO DO LIVRO? 

De certa forma ficam (o Capftulo 14 sobre 
MANOVA e mais diffcil do que o Capftulo 1), 
mas em outros casos, nao (o Capftulo 13, so¬ 


bre estatfstica nao-parametrica e menos com- 
plexo que o Capftulo 12, e o Capftulo 7, sobre 
o teste-t, e menos complexo do que Capftulo 6 
sobre regressao logfstica). 

Por que eu fiz isso? Ordenei os capftulos 
para ter coerencia estatfstica (para mim, pelo 
menos). Muitos livros ensinam varios testes 
isoladamente e nao apresentam a ideia global; 
isso, eu acho, cria um misterio desnecessario. 
A maioria dos testes neste livro e a mesma 
apresentada de uma maneira ligeiramente di- 
ferente. Assim, eu queria que o livro contasse 
essa historia. Para fazer isso, tenho que expli- 
car alguns conceitos, como o de regressao, 
bem no comego, porque quase tudo esta ba- 
seado nesse conhecimento! 

Entretanto, para ajuda-lo, codifiquei cada 
segao com um fcone, que representa a dificul- 
dade do conteudo. Eles nao significant que 
voce deva pular segoes (veja o Alex Esperto 
na proxima segao), mas irao informar se a 
segao esta no seu nfvel ou se ira exigir mais 
conhecimento de voce. Eu baseei esses fcones 
no meu modo de ensinar, portanto, eles podem 
nao se adequar a todos (especialmente porque 
sistemas variam em diferentes pafses!) 

© Isto significa “nfvel um” e eu o equi- 
parei ao primeiro ano da faculdade no Reino 
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Unido. Todos deveriam ser capazes de enten- 
der essas segoes. 

@ Este e o proximo nfvel e eu o equiparei 
ao segundo ano da faculdade no Reino Unido. 
Sao topicos que eu leciono no meu segundo 
ano e qualquer um com pouco de conheci- 
mento de estatfstica deveria ser capaz de en- 
tender. Entretanto, algumas dessas segoes sao 
desafiadoras mesmo para alunos do segundo 
ano. Sao segoes intermediarias. 

© Este e o “rn'vel 3” e representa topicos 
diffceis. Espero que alunos do ultimo ano do 
Reino Unido e recem-formados sejam capazes 
de lidar com essas secdes. 

@ Este e o nfvel mais alto e representa 
topicos muito diffceis. Espero que esses to¬ 
picos sejam muito desafiadores para estudan- 
tes da graduagao e recem-formados, mas os 
recem-formados, com um razoavel conheci- 
mento em metodos de pesquisa, nao deverao 
ter muitas dificuldades. 


POR QUE VOCE VE ROSTOS ESTUPIDOS 
EM TODOS OS LUGARES? 



Alex Esperto: Alex e um 
personagem muito importante 
porque ele aparece quando as 
coisas ficam diffceis. Ele e um 
pouco malandro, assim, quan¬ 
do a sua cara aparecer, voce sabera que algo 
complicado ira ser explicado. Quando o con¬ 
teudo diffcil termina, ele reaparece para infor- 
mar que e seguro continuar. Mas isso nao quer 
dizer que o resto do material do livro e facil; 
ele apenas informa as partes do livro que voce 
pode pular se tem coisas melhores a fazer com 
sua vida do que ler 800 paginas! Entao, quan¬ 
do o Alex Esperto aparecer, voce pode pular a 
segao inteira e ainda assim entender o que 
esta acontecendo. O Alex tambem aparece no 
final de cada capftulo apresentando algumas 
tarefas para testar se voce e tao esperto quanto 
ele. A proposito, qualquer semelhanga entre 
Alex e o meu editor e pura coincidencia! 


Samanta Ferrinho: Samanta odeia esta¬ 
tfstica. Na verdade, ela acha que tudo isso e 
uma perda de tempo. Ela simplesmente quer 


passar no exame e esquecer 
que teve de aprender distri- 
buigao normal. Assim, quando 
aparece, ela fornece um resu¬ 
mo dos pontos-chave que voce 
precisa saber. A Samanta lhe dara a informagao 
essencial para que voce nao fique procurando 
em centenas de paginas o que deseja saber. 



Brian Cansado: Brian 
aparece fazendo perguntas e 
completamente confuso. Por- 
tanto, ele nao e muito diferente 
do autor. A medida que o livro 
avanga, ele se torna cada vez mais desanima- 
do. Tire suas proprias conclusoes! 



Gato Curioso: Ele tambem aparece para 
fazer perguntas (porque ele e 
curioso). Na verdade, ele so 
esta aqui e porque eu queria 
um gato no livro... e, de pre- 
ferencia, um que se parecesse 
com o meu. E claro que os especialistas em 
educagao acham que ele precisa de um papel 
especffico, assim, seu papel e parecer boniti- 
nho e contar pessimas piadas sobre gatos. 



PARA QUE SERVEM OS QUADROS? 

Ha quadros ao longo de todo o livro. Os 
quadros podem ser ignorados, se voce quiser, 
porque sao lembretes inclufdos no texto. Eles 
explicam assuntos complicados ou ilustram 
pontos interessantes sobre estatfstica, com os 
quais voce pode impressionar seus amigos. 

0 QUE ESTA NO SITE*? 

O site contem muitas coisas interessantes: 

• Arquivo de dados: Em geral, voce ira 
usa-lo nos exemplos, porque ele contem 
todos os arquivos de dados dos exemplos 


* N. de R. O conteudo disponibilizado no site www.art- 
med.com.br esta em ingles. Consulte tambem: www. 
sagepub.co.uk/field, que contem materials adicionais 
para o estudante (conteudo em ingles). 
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do livro (os dados para cada capftulo es- 
tao contidos numa pasta separada). 

• Respostas para o Alex Esperto: Por- 
que nao quero matar mais arvores do que 
o necessario, ha centenas de materials 
adicionais no site. Os documentos mais 
importantes sao as resposta as tarefas no 
final de cada capftulo. Para cada tarefa, 
o documento content a safda do SPSS e 
uma breve explicagao, assim, voce pode 
checar suas respostas. 

• Material adicional: Para alguns topicos, 
escrevi longos documentos. Sao, princi- 
palmente, topicos avangados ou topicos 
para os quais uma explicagao detalhada 
no corpo do livro seria uma distragao. Em 


caso de alguem querer saber mais, ha des- 
crigoes no site. Por exemplo, ha arquivos 
sobre contrastes usando a sintaxe, a razao 
F de Welch, teste de Jonckheere e assim 
por diante. A maioria pode ignorar esses 
arquivos, mas eles estao no livro caso al¬ 
guem esteja interessado. 

• Material do apendice: Algum material 
do apendice (como os calculos matema- 
ticos) tambem foi colocado nos arquivos 
do site para economizar papel. 

• Programas: Ha uma copia do programa 
G*Power no site. 

Boa leitura! 



SIMBOLOS UTILIZADOS 


Operadores matematicos 

E Este sfmbolo (denominado sigma) sig- 

nifica “some tudo”. Assim, se voce vir 
algo como Ex, isso quer dizer “some 
todos os valores que coletou”. 
n Este sfmbolo significa “multiplique 

tudo”. Assim, se aparecer algo como 
Ilv, isso apenas quer dizer que voce 
deve “multiplicar todos os valores 
que coletou”. 

\fx Isto quer dizer “tire a raiz de x”. 

Simbolos gregos 

a E a probabilidade de cometer erro do 
Tipo I 

P E a probabilidade de cometer erro do 
Tipo II 

Pi Coeficiente da regressao padronizado 

X Estatfstica teste qui-quadrado 

X 2 f Estatfstica teste ANOVA de Fried¬ 

man 

e Normalmente significa “erro” 

r\ 1 Eta ao quadrado (uma medida do ta- 

manho de um efeito) 

[x A media de uma populagao de valores 

p O coeficiente de correla^ao popula- 

cional 


a 2 A variancia de um conjunto de dados 
populacionais 

a O desvio padrao de um conjunto de 
dados populacionais 
er x O erro padrao da media 
r Tau de Kendall (coeficiente de corre- 
lagao nao-parametrico) 
to 2 Omega ao quadrado (medida do ta- 
manho de efeito) 

Simbolos ingleses 

b t O coeficiente de regressao (nao-pa- 
dronizado) 

gl Graus de liberdade (df = degrees of 
freedom) 

e l O erro associado a i-esima pessoa 
F Razao F (estatfstica teste utilizada na 
ANOVA) 

H Estatfstica teste de Kruskal-Wallis 

k O numero de nfveis de uma variavel 

(isto e, o numero de condiqoes de um 
tratamento) ou o numero de previso- 
res num modelo de regressao 
In Logaritmo natural 

MS O erro medio ao quadrado (media ao 

quadrado). A variabilidade media nos 
dados 
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N, n, n, O tamanho da amostra. N normal- 
mente representa o tamanho de uma 
amostra qualquer enquanto n repre¬ 
senta o tamanho de uma particular 
amostra. 

P Probabilidade (o valor de uma proba- 
bilidade, o valor-/; ou a significance 
de um teste sao normalmente repre- 
sentados por p) 

r O coeficiente de correlagao de Pearson 

r b , r pb Coeficiente de corrclacao bisserial e 
coeficiente de correlagao ponto-bis- 
serial, respectivamente 

r s Coeficiente de corrclacao por postos 
de Spearman 

R O coeficiente de correlagao multiplo 
R 2 O coeficiente de determina^ao (isto e, 

a propor^ao da variancia dentro de al- 
guns dados explicados pelo modelo) 

5 O desvio padrao de uma amostra 

s 2 A variancia de uma amostra 
SS A soma dos quadrados ou a soma dos 
erros ao quadrado se for dado o nome 
completo 

SS A A soma dos quadrados para a varia- 
vel A 

SS M A soma dos quadrados do modelo 
(isto e, a variabilidade explicada pelo 
modelo ajustado aos dados) 

SS R A soma dos quadrados dos resfduos 
(isto e, a variabilidade que o modelo 
nao pode explicar, o erro no modelo) 
SS T A soma total dos quadrados (isto e, a 
total variabilidade dos dados) 
t A estatfstica teste de Student 

T A estatfstica para o teste de postos 
com sinais de Wilcoxon 
U A estatfstica para o teste de Mann- 
Whitney 

VP; A estatfstica para o teste da soma dos 
postos de Wilcoxon 
X ou x A media de uma amostra 
z Um ponto de dados expresso em uni- 

dades de desvio padrao 

Revisao matematica 

1. Dois negativos fazem um positivo: em- 

bora na vida dois erros nao fa^am um 


acerto, na matematica eles fazem! Quando 
multiplicamos um numero negativo por 
outro negativo, o resultado e um numero 
positivo. Por exemplo, —2 x —4 = 8. 

2. Um numero negativo multiplicado por 
um positivo produz um negativo: se 
voce multiplica um numero positivo por 
um negativo, o resultado e outro numero 
negativo. Por exemplo, 2 x—4 = —8 ou 
-2 x 6= -12 

3. PODMAS: e um acronimo para a ordem 
em que as opcracbes matematicas sao exe- 
cutadas. Ele significa Parenteses, Ordem, 
Divisao, Multiplicacao, Adi^ao e Subtra- 
5 ao, e essa e a ordem em que voce deve 
executar operates em uma expressao. 
Muitas dessas operacoes sao autoexplica- 
tivas (por exemplo, sempre calcule coisas 
dentro dos parenteses primeiro), exceto 
por ordens que de fato se referem a termos 
com potencias como quadrados. Quatro ao 
quadrado, ou 4 2 , e lido como quatro ele- 
vado na ordem dois, por isso esses termos 
sao denominados “ordem” em PODMAS 
(tambem, se os denominarmos de poten- 
cia, vamos ter PPODMAS, o que sera diff- 
cil de pronunciar). Vamos dar uma olhada 
em um exemplo de PODMAS: qual seria 
o resultado de 1 + 3 x 5 2 ? A resposta e 76 
(nao 100, como alguns de voces podem ter 
pensado). Nao existem parenteses, assim, 
o primeiro a fazer e lidar com o termo or¬ 
dem: 5 2 = 25, assim a expressao se torna 
1 + 3 x 25. Nao existe divisao, portanto, 
podemos passar para a multiplicacao: 3 x 
25, que resulta 75. PODMAS nos diz que 
agora e hora de lidarmos com a adipao: 1 
+ 75, que fornece o resultado 76. Se eu 
tivesse escrito a expressao original como 
(1 + 3) x 5 2 , a resposta seria 100 porque 
nesse caso devemos lidar primeiro com os 
parenteses: (1 + 3) = 4, assim a expressao 
toma-se 4 x 5 2 . Agora devemos lidar com 
o termo ordem e a expressao toma-se: 4 x 
25 = 100! 

4. http://www.easymaths.com e um bom lo¬ 
cal para uma revisao de conceitos mate- 
maticos basicos. 
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DE ESTUDANTES: 

O livro estd muito bem escrito. Estd tdo 
claro que e como se eu visse a estatistica, que 
eu estudei por tanto tempo, atraves de um par 
de oculos limpos. 

Megan Gray, Universidade de Sussex 

Sua combinagao da parte tecnica com o 
conceito e simplesmente maravilhosa. E o seu 
senso de humor, tambem! 

Abigail Levy 

Voce tem a habilidade de explicar coisas 
complexas de uma maneira simples e comp re- 
ensi'vel. 

Ruth Mann 

Eu ndo seria capaz de terminar meus es- 
tudos tdo facilmente se ndo fosse o seu livro. 

Marleen Smits, Universidade de 
Maastricht 

Seu livro me tornou um aluno muito mais 
feliz. 

Lisa Oliver, Universidade da Columbia 
Britanica 


Eu nunca vi conceitos tdo bem explicados 
ou ilustrados tdo claramente. 

Joel Philip 

Eu defendi minha dissertagdo em psico- 
logia em margo e seu livro SALVOU MINHA 
VIDA! 

Noelle Leonard 

Eu acho que voce vai para historia como 
a primeira pessoa a colocar humor em um li¬ 
vro de estatistica! 

Carol McSweeney, Universidade Brookes 

Voce e a mais pura expressdo de um bom 
professor! Embora eu ndo o conhega ou tenha 
assistido as suas aulas, sua empatia e seu de- 
sejo genuine de ajudar os estudantes se refle- 
tem no livro. 

Johannah Sirkka 
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Ano passado descobri suas paginas na 
rede (e, desse modo, seu livro) e ele transfor- 
mou completamente minhas aulas de estatis- 
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tica bdsica para alunos de pos-graduagdo de 
“ok” para “otimas”. Como resultado, este 
ano (e numfuturo proximo) usarei o seu livro 
como texto principal na minim classe. 

Michael Marsiske, Universidade da Florida 

Eu recomendei seu livro para um dos 
mens cursos e estou ansioso para que meus 
alunos cheguem. Leciono estati'stica ha 25 
anos e usei muitos livros. Mas este e o melhor. 
Voce me deu uma nova visao de coisas com as 
quais tive dificuldade por anos. 

Henry Steel, Universidade de Stellenbosch, 
Africa do Sul 

A maneira como voce consegue trazer o 
leitor ao mundo da estatistica avangada sem 
muito jargdo tecnico e admirdvel. 

Michael A. Karchmer, Diretor do Insti¬ 
tute de Pesquisa Gallaudet, Universidade de 
Gallaudet 


Muito obrigado por escrever um livro 
excelente e inspirador sobre um topico que e 
quase impossivel tornar interessante - voce 
fez um milagre! 

Dr. Keith Tolfrey, Professor Senior, De- 
partamento da Ciencia do Esporte e do Exer- 
cfcio, Universidade Metropolitana de Man¬ 
chester. 

Desde que o descobri, recomendei seu li¬ 
vro para os meus colegas e acho que pelo me- 
nos metade do departamento tern seu livro na 
estante agora. Quando alguem ndo sabe o que 
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consulte o Andy! 

Froukje Dijk, Universidade de Maastricht 
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1 

TUDO 0 QUE VOCE SEMPRE 
QUIS SABER SOBRE ESTATISTICA 

(BEM, QUASETUDO) 


1.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 

Sei que muitas pessoas usarao este livro 
para consultar somente os capftulos que des- 
crevem os testes estatfsticos que elas desco- 
briram de uma hora para outra que precisam 
utilizar. No entanto, para que esses capftulos 
fa^am sentido, talvez seja util saber algumas 
coisas sobre estatfstica. Este capftulo e uma 
tentativa de fornecer um breve panorama de 
alguns conceitos estatfsticos importantes, 
como o de utilizar modelos estatfsticos para 
responder questoes cientfficas. 

1.2 CONSTRUINDO MODELOS 
ESTATISTICOS © 

Nas ciencias sociais, normalmente es- 
tamos interessados em descobrir algo sobre 
um fenomeno que acreditamos que realmente 
exista (um fenomeno do mundo real). Esses 
fenomenos reais podem ser qualquer coisa 
desde o comportamento da taxa de juros no 
mercado economico ate comportamento de 
universitarios numa festa de final de semestre. 
Qualquer que seja o fenomeno que desejamos 
explicar, procuramos explica-lo coletando da¬ 
dos do mundo real e entao utilizando esses da¬ 


dos para tirar conclusoes sobre o que esta sen- 
do estudado. Como estatfsticos, nosso trabalho 
e pegar os dados disponfveis e utiliza-los de 
uma forma apropriada e isso, frequentemente, 
envolve construir modelos estatfsticos do fe¬ 
nomeno de interesse. 

A razao para construirmos modelos esta¬ 
tfsticos dos dados do mundo real e melhor ex- 
plicada por analogia. Imagine que um enge- 
nheiro quer construir uma ponte sobre um rio. 
Esse engenheiro seria bem bobo se construfs- 
se qualquer ponte com materiais ultrapassa- 
dos porque ela teria grandes chances de cair. 
Em vez disso, ele coleta dados do mundo real: 
olha para as pontes do mundo real e observa 
de que material elas sao feitas, que estruturas 
foram utilizadas (ele pode inclusive coletar 
dados sobre os defeitos que elas apresentam!). 
Ele, entao, usa essa informacao para construir 
um modelo. O engenheiro constroi um mode- 
lo, em escala, da ponte do mundo real porque 
e impraticavel, alem de caro, construir a ponte 
real. O modelo sera diferente da realidade em 
muitos aspectos - para comecar, ele sera me- 
nor - mas o engenheiro ira tentar construir o 
modelo que melhor se adapte ao seu interesse 
com base nos dados disponfveis. Uma vez que 
o modelo foi construfdo, ele pode ser usado 
para prever coisas sobre o mundo real: por 
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exemplo, o engenheiro 
podera testar se a ponte 
ira suportar fortes ven- 
tos colocando o modelo 
num tunel de vento. Ob- 
viamente, e necessario 
que o modelo seja uma 
representagao precisa 
do mundo real. Cientis- 
tas sociais fazem a mes- 
ma coisa que os engenheiros: constroem mo- 

delos de processos do mundo real na tentativa 
de prever como esses processos operam sob 

certas circunstancias. Nao temos acesso dire- 
to a esses processos, assim, coletamos dados 

que representam o processo e usamos esses 

dados para construir modelos estatfsticos (re- 
duzimos o processo a um modelo estatfstico). 

Depois, usamos esse modelo estatfstico para 
fazer previsoes sobre o fenomeno do mundo 

real. Assim como o engenheiro, queremos 

que nosso modelo seja o mais preciso possf- 

vel, para que possamos garantir que as pre¬ 

visoes que fizermos serao tambem precisas. 
Entretanto, diferente dos engenheiros, nao te¬ 
mos acesso a situagoes do mundo real e, desse 
modo, podemos somente inferir coisas sobre 


processos psicologicos, sociais ou economi- 

cos baseados nos modelos que construfmos. 

Se quisermos que nossas dedugoes sejam pre¬ 
cisas, o modelo estatfstico que construfmos 
deve representar os dados que coletamos (os 

que possfvel. O 
grau com que o modelo estatfstico representa 

os dados coletados e conhecido como aderen- 
cia do modelo e esse e um termo que voce ira 
ver frequentemente. 

A Figura 1.1 ilustra os tipos de modelos 
que um engenheiro pode construir para re¬ 
presentar a ponte do mundo real que ele quer 
criar. O primeiro modelo (a) e uma excelente 
representagao de uma situagao do mundo real 
e e conhecida como uma boa aderencia (isto 
e, existem algumas diferengas, mas o modelo e 
uma boa replica da realidade). Se esse modelo 
for utilizado para fazer previsoes sobre o mun¬ 
do real, o engenheiro pode confiar que essas 
previsoes serao precisas, porque o modelo re¬ 
presenta bent a realidade. Assim, se o modelo 
desabar com um vento forte, havera uma boa 
chance de que a ponte real desabara tambem. 
O segundo modelo (b) tern algumas semelhan- 
gas com o mundo real: o modelo inclui algu¬ 
mas caracterfsticas basicas de estrutura, mas 




Figura 1.1 Ajustando modelos ao mundo real (veja o texto para detalhes). 
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ha grandes ditcrencas da ponte do mundo real 
(isto e, a ausencia de uma das torres de supor- 
te). Chamamos isso de aderencia moderada 
(isto e, ha algumas diferengas entre o modelo 
e os dados, mas ha tambem grandes similari- 
dades). Se o engenheiro usar esse modelo para 
fazer previsoes sobre o mundo real, essas pre¬ 
visoes poderao ser imprecisas e possivelmente 
catastroficas (por exemplo, se a ponte desabar 
com ventos fortes isso sera devido a ausencia 
da segunda torre de suporte). Portanto, o uso 
desse modelo resulta em previsoes nas quais 
podemos confiar parcialmente, mas nao total- 
mente. O modelo final (c) e completamente 
diferente da situacao do mundo real. Esse mo¬ 
delo nao possui semelhangas estruturais com 
a ponte real e pode ser chamado de modelo 
de pouca aderencia (na verdade, pode ser mais 
precisamente descrito como uma aderencia 
abismal!). Assim, qualquer previsao baseada 
nesse modelo provavelmente sera imprecisa. 
Estendendo essa analogia para as ciencias so- 
ciais, podemos dizer que e importante quando 
um modelo estatfstico adere bem a um con- 
junto de dados. Se o nosso modelo nao aderir 
bem aos dados observados, nossas previsoes 
serao igualmente pobres. 

1.3 POPULAgOES E AMOSTRAS ® 

Como pesquisadores, estamos interessa- 
dos em encontrar resultados que se apliquem 
a toda uma populagao de pessoas ou coisas. 
Por exemplo, psicologos querem descobrir 
processos que ocorrem em todos humanos, 
biologos podem estar interessados em pro¬ 
cessos que ocorrem em todas as celulas, eco- 
nomistas querem construir modelos que se 
aplicam a todos os salarios, e assim por dian- 
te. A populagao pode ser geral (todos os seres 
humanos) ou muito pequena (todos os gatos 
machos de pelo castanho-avermelhado cha- 
mados Bob), mas em ambos os casos os cien- 
tistas raramente, senao nunca, terao acesso a 
cada membro de uma populagao. Psicologos 
nao podem coletar dados de cada ser huma- 
no e ecologistas nao podem observar cada 
gato macho de pelo castanho-avermelhado 


chamado Bob. Portanto, coletamos dados de 
um pequeno subconjunto de uma populagao 
(chamado de amostra) e usamos essas infor- 
magoes para inferir coisas sobre toda a po¬ 
pulagao. O engenheiro construtor de pontes 
nao pode fazer um modelo de tamanho real da 
ponte que ele quer construir, assim, ele cons- 
troi um modelo em escala menor e testa esse 
modelo sob varias condigoes. Dos resultados 
obtidos do modelo em escala menor, o enge¬ 
nheiro infere coisas sobre como a ponte de 
tamanho real ira responder. O modelo em es¬ 
cala menor podera responder diferentemente 
da versao em escala real, mas, quanto maior o 
modelo, maior a probabilidade de ele se com- 
portar como a ponte de tamanho real. Essa 
metafora pode ser estendida a cientistas so- 
ciais. Nunca temos acesso a populagao inteira 
(a ponte de tamanho real), assim, coletamos 
pequenas amostras (a ponte em escala menor) 

e usamos o comportamento dentro da amostra 

para inferir coisas sobre o comportamento da 

populagao. Quanto maior a amostra, maior a 

teira. Se pegarmos muitas amostras aleato- 

rias da populagao, cada uma dessas amostras 
fornecera resultados ligeiramente diferentes. 

Entretanto, em media, resultados de grandes 
amostras deverao ser bastante similares. 

1.4 MODELOS ESTATISTICOS 
SIMPLES ® 

1.4.1 A media, a soma dos quadrados, a 
variancia e o desvio padrao ® 

Um dos modelos mais simples usados em 
estatistica e a media. Alguns de voces podem 
estranhar pensar na media como um mode¬ 
lo, mas, na verdade, e porque ela representa 
um resumo dos dados. A media e um valor 
ico que pode ser calculado para qual- 
quer conjunto de dados; ela nao precisa ser 
um valor realmente observado no conjunto de 
IMjlos. Por exemplo, se pegarmos cinco pro- 
fessores de estatistica e contarmos o numero 
de amigos que eles tern, poderemos encontrar 
os seguintes dados: 1, 2, 3, 3 e 4. Se pegarmos 
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a media do numero de amigos, isso podera ser 
calculado adicionando os valores obtidos e di- 
vidindo pelo numero de valores contados: (1 
+ 2 + 3 + 3 + 4)/5 = 2,6. Sabemos que e 
impossfvel ter 2,6 amigos (a nao ser que voce 
corte alguem com uma serra e seja amigo do 
seu brago), assim, a media e um valor hipo- 
tetico. Portanto, a media e um modelo criado 
para resumir nossos dados. Agora, podemos 
determinar se esse modelo e preciso verifican- 
do quao diferente os nossos dados reais sao 
do modelo que criamos. Uma maneira de fa- 
zer isso e olhar a diferenga entre os dados que 
observamos e o modelo ajustado. A Figura 1.2 
mostra o numero de amigos que cada profes¬ 
sor de estatfstica tern e, tambem, o numero 
medio que anteriormente calculamos. A linha 
representando a media e o nosso modelo e os 
cfrculos sao os dados observados. O diagra- 
ma tem, tambem, uma serie de linhas verticals 
que conectam cada valor observado ao valor 
da media. Essas linhas representam os desvios 
entre os dados observados e o nosso modelo e 
podem ser pensadas como o erro do modelo. 
Podemos calcular a magnitude desses desvios 
simplesmente subtraindo a media (x) de cada 


um dos valores observados (x,) 1 . Por exemplo, 
o professor 1 tem somente 1 amigo, portanto, 
a diferenga e: x, — x = 1 — 2,6 = —1,6. Voce 
deve notar que o desvio e um numero negativo 
e ele representa o fato de que nosso modelo 
superestimou a popularidade desse profes¬ 
sor: ele preve que o professor tera 2,6 amigos 
quando, na verdade, ele tem somente 1 amigo 
(sorte para ele!). Agora, como podemos usar 
esses desvios para estimar a precisao do mo¬ 
delo? Uma possibilidade e somar os desvios 
(isso fornecera uma estimativa do erro total). 
Se fizermos isso, acharemos: 

Erro total = soma dos desvios 

= ^(x,-x) = (-l,6) + (-0,6) 

+ (0,4)+ (0,4)+ (1,4) =0 

O resultado diz que nao ha um erro total 
entre nosso modelo e os dados observados, 


1 O x t simplesmente se refere ao escore observado para 
a i-esima pessoa (assim, pode ser trocado por um nu¬ 
mero que representa um determinado indivfduo). Para 
esses dados: o professor 1, x t — x x = 1; o professor 3, x, 
= x 3 = 3; o professor 5, x, — x 5 — 4. 



Figura 1.2 Grafico mostrando as diferengas entre o numero observado de amigos que cada 
professor de estatfstica tem e o numero medio de amigos (linha tracejada). 
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assim, a media e uma representacao perfeita 
dos dados. Mas isso obviamente nao e ver- 
dade: houve erros, alguns deles foram posi- 
tivos e alguns negativos e eles simplesmente 
cancelaram uns aos outros. Devemos evitar o 
problema do erro direcionado (isto e, positi- 
vo ou negativo) e uma maneira matematica de 
fazer isso e elevar cada erro ao quadrado 2 , ou 
seja, multiplicar cada erro por ele mesmo. As¬ 
sim, em vez de calcularmos a soma dos erros, 
calculamos a soma dos quadrados dos erros. 
Neste exemplo: 

Soma dos erros 

ao quadrado (SS) = ^(nq — x) (+ — x) 

= (— 1 . 6) 2 + (— 0 , 6) 2 
+ (0,4) 2 + (0,4) 2 + (1,4) 2 
= 2,56 + 0,36 + 0,16 
+ 0,16+ 1,96 = 5,20 


medida: ela e expressa em unidades quadra- 
das (porque colocamos cada erro ao quadrado 
no calculo). Em nosso exemplo, teremos que 
dizer que a media do erro em nossos dados 
(a variancia) foi 1,3 amigos ao quadrado. Se 
ja faz pouco sentido falar de 1,3 amigos, faz 
menos sentido ainda falar de amigos ao qua¬ 
drado! Por essa razao, geralmente tiramos a 
raiz quadrada da variancia (o que garante que 
o erro medio sera expresso na mesma unidade 
da variavel). Essa medida e conhecida como 
desvio padrao e e simplesmente a raiz qua- 
Neste exemplo o desvio 

padrao e: 


Desvio padrao = s = ^ 

= Vf 30 

= 1,14 


boa medida da acuracia do nosso modelo. Con- 
tudo, e obvio que a soma dos erros ao quadrado 
depende do total de dados que foram coletados - 
quanto mais dados, maior o SS. Para solucionar 
esse problema, calculamos a media dos erros di- 
vidindo o SS pelo numero de observaqoes (N). 
Se estivermos somente interessados na media 
do erro para a amostra, podemos dividir apenas 
por N. Entretanto, geralmente estamos interes¬ 
sados em usar o erro na amostra para estimar o 
erro na populaqao e, assim, dividimos o SS pelo 
numero de observaqoes menos 1 (a explicaqao 
esta no Quadro 8.2). Essa medida e conhecida 
como variancia e voce a usara muito. 


Variancia = s 2 


SS 

»-a 


^](x ; -.a) 2 

frW 



A variancia e, portanto, a media do erro 
entre a media e as observaqoes feitas (e e a me¬ 
dida de como o modelo corresponde aos dados 
reais). Existe um problema da variancia como 


2 Quando voce multiplica um numero negativo por ele 
mesmo ele se torna positivo. 


de quao bem a media representa os dados. Pe- 
quenos desvios padroes (relativos ao valor da 
propria media) indicam que pontos de dados 
estao proximos da media. Um desvio padrao 
grande (relativo a media) indica que os pon¬ 
tos de dados estao distantes da media (isto e, a 
media nao e uma representacao precisa dos da¬ 
dos). Um desvio padrao de 0 significaria que 
todos os escores sao os mesmos. A Figura 1.3 
mostra um indice geral (em uma escala de cin- 
co pontos) dos dois professores depois de cada 
uma das cinco aulas. Ambos os professores 
tiveram uma media de 2,6 em uma escala de 
5 pontos. Entretanto, o primeiro professor tern 

queno se comparado a me'dia). Deve ficar claro 
no grafico que os indices para esse professor 
estavam consistentemente proximos do valor 

em geral suas aulas nao variaram em populari- 

precisa dos seus indices. A media teve uma 

boa aderencia aos dados. O segundo professor, 
entretanto, teve um desvio padrao de 1,82 (re- 
lativamente alto comparado a media). Os indi¬ 
ces para esse professor estao claramente mais 
espalhados em torno da media; isto e, para 
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algumas aulas ele recebeu indices muito al¬ 
tos e para outras seus indices foram horrfveis. 
Portanto, a media nao e uma representagao tao 
precisa da sua performance porque houve mui- 
ta varia 9 ao na popularidade das suas aulas. A 
media mostrou uma aderencia pobre aos da¬ 
dos, nesse caso. Esta ilustracao devera deixar 
clan>‘ |MW BiWBgfn> PJdruo’d'uma m edi’ctajLle i 

A discussao das medias, somas dos qua- 
drados e da variancia pode parecer um desvio 
do ponto inicial, mas, na verdade, a media e 
provavelmente um dos modelos estatisticos 
mais simples que pode ser ajustado aos dados. 
O que eu quero dizer com isso? Bern, tudo em 
estatfstica se resume a uma equa^ao: 

Saida,- = (Modelo,) + erro, (1.1) 

Isso apenas significa que os dados que 
observamos podem ser previstos pelo mode¬ 
lo que escolhemos para ajustar os dados mais 
um erro. Quando eu digo que a media e um 
modelo estatistico simples, o que quero dizer 
e que podemos trocar a palavra “modelo” pela 
palavra “media”, na equa^ao (1.1). Se voltar- 
mos ao nosso exemplo envolvendo o niimero 
de amigos que os professores de estatfstica 
tern e olharmos para o primeiro professor, por 


exemplo, observamos que ele tinha um amigo 
e a media de todos os professores foi 2,6. As- 
sim, a equacao se torna: 

Saida professorl X -\- £p r ofesssori 

1 £professorl 

Disso podemos entender que o erro e 1 
— 2,6, ou —1,6. Se substituirmos esse valor 
dentro da equacao, teremos 1 = 2,6 — 1,6 ou 
1 = 1. Embora isso parega obvio, vale ter essa 
equagao em mente ao longo do livro, porque 
voce ira descobrir que a maioria das coisas se 
resume a uma ideia simples! 

Da mesma forma, a variancia e o desvio 
padrao ilustram outro conceito fundamental: 
como a aderencia de um modelo pode ser me- 
dida. Se estivermos interessados em avaliar 
quao bem o modelo se adequou aos dados 
(nesse caso nosso modelo e a media), entao 

geralmente olhamos para os desvios do mode¬ 
lo, avaliamos a soma dos erros ao quadrado e, 
de forma geral, podemos escrever isso como: 

Desvio = y '’ (observado - modelo) 2 (1.2) 

Ou seja, avaliamos modelos comparando 
os dados que observamos ao modelo utilizado 
e elevamos as diferencas observadas ao qua- 




0123456 0123456 

Aula Aula 

Figura 1.3 Grafico ilustrando dados que apresentam a mesma medida, mas desvios padrao di- 
ferentes. 
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drado. Essa ideia fundamental se repetira ao 


DE FREQUENCES © 

Depois de cole- 
tar alguns dados, algo 
muito util a fazer e um 
grafico de quantas ve- 
zes cada escore ocor- 
re. Isso e conhecido 
como distribuigao de 
iteau encias ou histo- 
grama, que e simples- 
mente um grafico com 
os valores observados 
no eixo horizontal, com barras mostrando quan¬ 

tas vezes cada valor ocorreu no conjunto de da- 

valores. Olhando para o escore que apresenta a 
barra mais alta, podemos imediatamente ver a 
moda, que e simplesmente o escore que ocorre 
mais frequentemente num conjunto de dados. 

Distribuigdes de frequencias ocorrem de 
muitas formas e tamanhos diferentes. E muito 
importante, portanto, ter algumas descrigoes 
gerais para os tipos mais comuns de distribui¬ 
goes. Em um mundo ideal, nossos dados esta- 
riam distribufdos simetricamente em volta do 
centra de todos os escores. Assim, se tragas- 
semos uma linha vertical pelo centra da dis¬ 
tribuigao, ela deveria ser a mesma em ambos 

normal e e caracterizado por uma curva em 

Essa forma basicamente sugere que a maioria 

dos escores esta em torno do centra da distri¬ 
buigao (assim, as barras maiores no histogra- 
ma estao em volta do valor central). Tambem, 
a medida que nos distanciamos do centra, as 
barras ficam menores, sugerindo que a medi¬ 
da que os escores comegam a se desviar do 
centra, sua frequencia diminui. Afastando-nos 
ainda mais do centra a frequencia dos nossos 
escores se torna muito baixa (as barras sao 
muito pequenas). Um exemplo de distribuigao 
normal e mostrado na Figura 1.4. 


longo de todo o livro. 


1.5 DISTRIBUTES 



1.5.1 Propriedades das distribuigoes de 
frequencias © 

normal de duas maneiras principals: (1) falta 
de simetria (chamado de assimetria) e (2) 
achatamento (chamado de curtose). Distri¬ 
buigoes assimetricas nao sao parelhas e, em 
vez disso, os escores mais frequentes (a parte 

mais alta do grafico) estao concentrados em 
um dos lados da escala. Uma distribuigao as- 
simetrica pode ser positivamente assimetrica 
(a maioria dos escores esta concentrada a es- 
querda da escala) ou negativamente assime¬ 

trica (a maioria dos pontos esta concentra- 
idariwteBgitiMdaissgateiai A Eigura 1.5 mostra 
exemplos dessas distribuigoes. 

As distribuigoes tambem variam no 
seu achatamento ou curtose. A curtose, ape- 
sar de soar como um tipo de doenga exotica 
refere-se ao grau que os escores estao concen¬ 
trados na cauda da distribuigao. Essa caracte- 
rfstica e avaliada por um grau de achatamen¬ 
to (achatada ou pontiaguda) da distribuigao. 
Uma distribuigao platicurtica e aquela que 
tern muitos escores nas caudas (chamada de 
distribuigao com cauda pesada) sendo, por¬ 
tanto, bem achatada. Em contraste, as distri¬ 
buigoes leptocurticas sao relativamente finas 
e parecem bem pontudas. Voce pode lembrar 
disso assim: “distribuigoes leptocurticas se 
elevam no ar enquanto que as distribuigoes 
platicurticas ficam achatadas como um plato 
(Figura 1.6), ou para os surrealistas entre vo¬ 
ces podem lembrar-se delas como “as distri¬ 
buigoes platicurticas sao ‘boas de bico’ e as 
distribuigoes leptocurticas ‘compulsivamente 
roubam coisas’.”fdealisticamente queremos 
que nossos dados sejam distribufdos de forma 
normal (isto e, nem muito assimetricos, nem 

muito pontiagudos ou achatados!). 

Em uma distribuigao normal os valores da 
assimetria e da curtose sao 0* (isto e, a dis- 


N de R. T. De fato, o coeficiente de curtose foraece um 
valor igual a 3 para a curva normal. Centrado o valor 
(isto e, subtraindo 3), temos o coeficiente de curtose 
centrado que e igual a zero para a curva normal. E esse 
valor ao qual o autor esta se referindo. 
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Figura 1.4 Uma distribuigao "normal" (a curva mostra a forma idealizada). 
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Figura 1.5 Uma distribuigao positivamente (esquerda) e negativamente (direita) assimetrica. 




tribuigao nao e muito pontiaguda nem muito 
achatada e e perfeitamente simetrica). Se a 
distribuigao tem valores de assimetria ou cur- 
tose acima ou abaixo de 0, isso indica um des- 
vio da normal (veja o Capitulo 3). 

1.5.2 0 desvio padrao e a forma da 
distribuigao © 

Assim como fornecem uma ideia da pre- 
cisao da media como um modelo do nosso 
conjunto de dados, a variancia e o desvio pa¬ 


drao tambem nos informam sobre a forma da 
distribuigao dos escores. Se a media represen- 
ta bem os dados, a maioria dos escores ira se 
concentrar perto da media e o desvio padrao 
resultante e pequeno quando comparado a 
media. Quando a media e uma representagao 
ruim dos dados, os escores se espalham mais 
ao redor da media (lembre-se da Figura 1.3) 
e o desvio padrao e maior. A Figura 1.7 mos¬ 
tra duas distribuigoes que tem a mesma media 
(50), mas desvios padrao diferentes. Uma tem 
um desvio padrao maior em relagao a media 
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Figura 1.6 Uma distribuigao leptocurtica (esquerda) e platicurtica (direita). 




(DP = 25) e isso resulta em uma distribuigao 
achatada que esta mais espalhada, enquanto a 
outra tem um desvio padrao menor em relagao 
a media (DP = 15), resultando em uma dis¬ 
tribuigao mais pontiaguda em que os escores 
proximos da media sao mais frequentes, mas 
escores distantes da media tornam-se muito 
infrequentes. A ■mens.rigniBp'ujn'^i 
medida que o desvio padrao fica maior, a dis¬ 
tribuigao tende a ficar mais achatada. 

1.5.3 0 que e a distribuigao normal 
padrao? © 

Outra maneira de olhar as distribuicoes 
de frequencia e em termos de probabilidade: 
eles fornecem uma ideia da probabilidade de 


Desvio padrao grande 



Escore 


um dado escore acontecer. Beachy Head e um 
rochedo grande e ventoso na costa de Sussex 
(nao muito longe de onde eu moro) e tem uma 
reputagao de atrair suicidas, que parecem 
gostar de se jogar dele (e apos meses e meses 
reescrevendo este livro, meus pensamentos 
levam-me, cada vez mais, na diregao daque- 
le rochedo tranquilo). A Figura 1.8 mostra a 
distribuigao de frequencias de alguns dados 
anuais inventados sobre o numero de suicldios 
em Beachy Head, cometidos por pessoas de 
diferentes idades (embora eu tenha inventado 
esses dados, eles sao baseados, grosseiramen- 
te, em estatlsticas gerais de suicldio como os 
de Williams, 2001). Houve 171 suicldios no 
total e voce pode ver que a populagao de suici¬ 
das tinha, mais frequentemente, idade entre 25 


Desvio padrao pequeno 



Escore 


Figura 1.7 Duas distribuigoes com a mesma media, mas com desvios padrao grande e pequeno. 
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Idade 

Figura 1.8 Distribuigao de frequences mostrando o numero de suicidios anuais por faixa etaria. 


e 30 anos (a barra mais alta), o que e bastante 
preocupante para mim (embora isso signifique 
que se eu conseguir passar por este ano a von- 
tade ira diminuir no ano que vem!). O grafi- 
co tambem nos diz que, por exemplo, poucas 
pessoas acima de 70 anos cometeram suicfdio 
em Beachy Head. 

Afirmei anteriormente que podfamos pen- 
sar nas distribuigoes de frequencia em termos de 
distribuigao de probabilidade. Para explicar isso, 
imagine que alguem pergunte a voce o seguin- 
te: “qual e a probabilidade de uma pessoa de 70 
anos cometer suicfdio em Beachy Head?”. Qual 
seria a sua resposta? As chances sao, se voce 
olhar a distribuigao de frequences, de sua res¬ 
posta ser “pouco provavel”, pois ha apenas duas 
pessoas do grupo de 171 suicidas com idade em 
torno de 70 anos. E se alguem perguntar “qual e 
a probabilidade de uma pessoa de 30 anos come¬ 
ter suicfdio?”. De novo, olhando o grafico, voce 
podera dizer “e bastante provavel”, pois 32 dos 
171 suicidas eram pessoas com idade em torno 
de 30 anos (isso e mais do que uma em cada cin- 
co pessoas que cometeram suicfdio). 


Assim, baseado na frequencia de dife- 
rentes escores deve comegar a ficar claro que 
podemos usar essa informagao para estimar a 
probabilidade que um determinado escore ira 
ocorrer. Portanto, poderfamos perguntar, com 
base em nossos dados, qual e a probabilida¬ 
de de uma vftima de suicfdio ter entre 16 e 20 
anos? O valor da probabilidade pode variar de 
0 (nao ha chance alguma de o evento aconte- 
cer) a 1 (o evento definitivamente ira aconte- 
cer). Assim, por exemplo, quando eu falo com 
meus editores digo que ha a probabilidade de 
1 que irei completar a revisao deste livro por 
volta de junho de 2003. Entretanto, quando 
falo com outras pessoas, posso mais realisti- 
camente dizer que ha a probabilidade de 0,1 de 
eu terminar as revisoes a tempo (ou seja, 10% 
de chance* ou 1 chance em 10 que eu com- 
pletarei o livro no tempo previsto). Na verda- 
de, a probabilidade de eu terminar no tempo 


* N. de T.: Como voce ja deve ter notado, o autor utiliza 
o termo “chance” como sinonimo de probabilidade, o 
que nem todos o fazem e nem sempre e o caso. 
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previsto e 0 (nenhuma chance mesmo!) porque 
nunca consigo terminar na data prevista pelos 
editores! Se as probabilidades nao fazem sen- 
tido para voce, apenas ignore o ponto decimal 
e pense nelas como percentagens (isto e, a pro- 
babilidade de 0,1 de algo acontecer e o mesmo 
que 10% de chance de que algo acontega). 

Falei vagamente sobre como distribuigoes 
de frequences podem ser usadas para obter uma 
ideia aproximada da probabilidade de um esco- 
re ocorrer. Entretanto, e necessario ser preciso. 
Para qualquer distribuigao de escores poderia- 
mos, teoricamente, calcular a probabilidade de 
obter um escore de certo tamanho - seria muito 
entediante e complexo faze-lo, mas poderfa- 
mos. Para poupar nossa sanidade, os estatisticos 
identificaram muitas distribuigoes. Para cada 
uma eles elaboraram uma formula matematica 
que especifica versoes idealizadas dessas distri¬ 
buigoes (elas estao especificadas em termos de 
uma curva). Essas distribuigoes idealizadas sao 
conhecidas como distribuigoes de probabilidade 
e a partir delas e possfvel calcular a probabilida¬ 
de de conseguir escores baseados nas frequen¬ 
cias com que um escore particular ocorre. Umas 
dessas distribuigoes e a distribuigao normal, ja 
mencionada. Os estatisticos calcularam a pro¬ 
babilidade de certos escores ocorrerem numa 
distribuigao normal com a media 0 e o desvio 
padrao de 1. Portanto, se tivermos qualquer 
conjunto de dados que possua a forma de uma 
distribuigao normal e se a media e o desvio pa¬ 
drao sao 0 e 1, respectivamente, podemos usar a 
tabela de probabilidades para a distribuigao nor¬ 
mal a fim de ver qual e a probabilidade de um 
determinado escore ocorrer nos dados (fiz uma 
tabela no Apendice deste livro)*. 

O problema obvio e que nem todos os 
dados que coletamos terao uma media 0 e o 
desvio padrao 1! Por exemplo, podemos ter 
um conjunto que tem uma media de 567 e um 
desvio padrao de 52,98! Felizmente, qualquer 


* N. de T.: O autor esta falando de uma forma bastante 
informal, pois, de fato, a probabilidade de um valor es- 
pecifico ocorrer em uma distribui§ao normal e zero. A 
probabilidade so e diferente de zero em um intervalo 
de valores. Note que ele, ao calcular, utiliza intervalos 
(70 ou mais e 70 ou menos). 


conjunto de dados pode ser convertido em um 
conjunto que tenha a media 0 e o desvio padrao 
1. Primeiro, para centrar os dados em zero, pe- 
gamos cada escore e subtrafmos dele a media 
de todos os escores. Depois, dividimos o esco¬ 
re resultante pelo desvio padrao para assegurar 
que os resultados terao um desvio padrao de 
■ Os escores resultantes sao conhecidos como 
escores-z e, na forma de equagao, a conversao 

- 

■ 

A tabela das probabilidades que foi calcula- 
da para a distribuigao normal padrao e mostrada 
no Apendice. Por que essa tabela e importante? 
Bern, se olharmos os dados sobre suicidio, po¬ 
demos responder a pergunta “qual 6 a probabi¬ 
lidade de alguem que se jogou de Beachy Head 
ter 70 anos ou mais?”. Primeiro, convertemos 
70 em um escore-’. Digamos que a media dos 
escores de7sui'&y(yfor3j§:e ? 6T(fesvidlp^iM^ U3|i 
O valor. 70 lrd tornar-se (70 — 3,6)/13 = 2,62. 
Depois, olhamos esse valor na coluna chamada 
“porgoes menores” (isto e, a area acima do va¬ 
lor 2,62). Devemos encontrar que a probabili¬ 
dade e M(W4fc ou~seia,. somente 0,44% de chan¬ 
ce que uma vftima de suicidio tenha 70 anos ou 
BWMWhMmaMaiBMIigllHMiyMtl a. de “porgoes 

a probabilida¬ 
de de que a vftima de suicidio tenha 70 anos ou 
fii^lllfcaMi«BiMMa8MMI 9956. ou seja, 
@SStS®Wfi?dhf®b>diique‘'uma vftima de sui¬ 
cidio tenha menos de 70 anos! 

Espero que voce possa ver a partir desses 
exemplos que a distribuigao normal e os esco- 
res-z nos permitem ir, um passo alem dos nos- 
sos dados, no sentido que de um conjunto de 
escores podemos calcular a probabilidade que 
um determinado escore ira acontecer. Assim, 
podemos ver se os escores de certo tamanho 
podem ou nao ocorrer em uma distribuigao 
de um tipo particular. Voce vera quao util isso 
e em seu devido tempo, mas vale mencionar, 
neste estagio, que certos escores-z sao particu- 
larmente importantes. Isso porque seus valo¬ 
res sao pontos de corte destacando percenta¬ 
gens importantes da distribuigao. O primeiro 
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valor importante de z e 1,96, pois ele separa 
os 2,5% do topo da distribuigao e o seu oposto 
(—1,96) destaca os 2,5% da cauda inferior da 
distribuigao. Assim, tornados juntos, esses va- 
lores destacam 5% dos escores ou, colocando 
de outra maneira, 95% dos escorcs-z estao en- 
tre — 1,96 e +1,96. Os outros dois importantes 
pontos de referenda sao os valores ±2,58 e 
±3,29, que destacam 1% e 0,1% dos escores, 
respectivamente. Ou seja, 99% dos escores-z 
estao entre —2,58 e 2,58 e 99,9% deles estao 
entre —3,29 e 3,29. Lembre-se desses valores 
porque eles irao aparecer com frequencia! 

1.6 A MINHA AMOSTRA E 
DA 


Vimos que o 
desvio padrao e as 
distribuigbes das fre¬ 
quencias nos dizem 
algo sobre quao bem 
a media representa 
aqueles dados, mas 
mencionei anterior- 
mente que em geral 
coletamos dados de 
amostras em vez de toda uma populagao. Tam- 
bem falei que se voce retirar varias amostras de 
uma populagao, elas irao diferir um pouco uma 
da outra. Portanto, e tambem importante saber 
quao bem uma amostra em particular representa 

'■liriii'FtEjV f i <oSpJ!uljI' CIS 
Muitos estudantes nao entendem a diferenga 

nunca 

um conceito 

importante que deve ser entendido, portanto, 
farei o possfvel para explica-lo. 

Ja aprendemos que cientistas sociais 
usam amostras como uma forma de estimar o 
comportamento de uma populagao. Imagine 
que estamos interessados nos Indices de todos 
os professores (assim, professores em geral 
e a populagao). Podemos pegar uma amostra 
dessa populagao. Quando alguem toma uma 


REPRESENTATIVA 
P0PULAQA0? © 

1.6.1 Oerro padrao© 



amostra da populagao, esta pegando uma de 
muitas amostras possfveis. Se pegarmos mui- 
tas amostras de uma mesma populagao, cada 

amostra tera a sua propria media e em varias 
dessas amostras as medias serao diferentes 
(nem toda amostra tera a mesma media). 

nar amostras de uma populagao. Imagine que 
podemos ter os indices de todos os professores 
do planeta e que o indice medio e 3 (essa e a 
media da populagao). E claro que nao pode¬ 
mos coletar os indices de todos os professores, 
portanto, usamos uma amostra. Para cada uma 
dessas amostras podemos calcular uma medida 
de posigao ou media da amostra. Vamos imagi- 
nar que selecionamos nove amostras diferentes 
(como no diagrama). Voce pode ver que algu- 
mas das amostras tern a mesma media que a po¬ 
pulagao e algumas tern medias diferentes; a pri- 
meira amostra de professores teve media igual 
a 3, mas a segunda teve media igual a 2. Isso 
ilustra a variagao amostral, isto e, as medias 
irao variar porque elas content elementos dife¬ 
rentes da populagao; a amostra que por acaso 
incluir alguns bons professores ira ter uma me¬ 
dia maior do que uma amostra que, por acaso, 
incluir alguns pessimos professores! Podemos 
representar as medias amostrais como uma dis- 
tribuigao de frequencias ou histograma 3 , exata- 
mente como fiz no diagrama. 

Essa distribuigao mostra que tres amos¬ 
tras tinham a media 3, medias de 2 e 4 ocor- 
reram em duas amostras cada e medias de 1 e 
5 ocorreram apenas em uma amostra cada. O 
resultado final e uma bela distribuigao simetri- 
ca conhecida como distribuigao amostral. Uma 
distribuigao amostral e simplesmente uma dis¬ 
tribuigao de frequencias das medias de todas as 
amostras de uma mesma populagao. Teorica- 
mente, selecionarfamos centenas ou milhares 
de amostras para construir uma distribuigao 
amostral, mas estou usando apenas nove para 
simplificar o diagrama! A distribuigao amostral 
apresenta o comportamento das amostras da 
populagao e voce notara que ela esta centrada 


3 Ele e um grafico de cada media amostral representada 
contra o numero de amostras que apresentam essa me¬ 
dia - ver o capftulo 2 para detalhes. 
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populagao 


li = 3 



0 1 2 3 4 5 6 

Media da amostra 


Figura 1.9 Figura ilustrando o erro padrao (veja o texto para detalhes). 
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no mesmo valor que a media da populagao (isto 
e, 3). Isso significa que, se calcularmos a me¬ 
dia de todas as medias das amostras, teremos o 
mesmo valor da media da populacao. Agora, se 
a media das medias das amostras e igual a me¬ 
dia da populacao e se conhecermos com preci¬ 
sao aquela media, saberemos algo sobre quao 
provavel e que uma amostra qualquer represen¬ 
te a populagao. Entao, como determinamos a 
precisao da media da populacao? 

Lembre a discussao sobre o desvio pa¬ 
drao. Usamos o desvio padrao como uma 

dados observados. Pequenos desvios padroes 
representam um cenario no qual a maioria dos 

drao grande representa uma situagao na qual 
os dados estao bem mais espalhados em torno 
da media. Se voce calcular o desvio padrao 
entre as medias das amostras, isso fornecera 

tre as medias de diferentes amostras. O desvio 
padrao entre as medias das amostras e deno- 
minado erro padrao da m<llla\fjll|| (Portanto, 

a diferenga entre cada media da amostra e a 
media geral (media das medias de todas as 
amostras ou media da populagao), elevando 
ao quadrado essas diferengas, somando-as, e, 
entao, dividindo-as pelo ntimero de amostras. 

E claro que, na realidade, nao podemos 
selecionar centenas de amostras e, assim, nos 
baseamos numa aproximacao do erro padrao 
(felizmente, muitos estatisticos espertos calcu- 
laram maneiras em que o erro padrao pode ser 


estimado a partir do desvio padrao da amos¬ 
tra). Felizmente, nao precisamos entender por 
que essa aproximagao funciona. Podemos ape- 
nas confiar que essas pessoas sao inteligentes 
e sabem do que estao falando. Sjgbgrro padrao 
pode ser calculado dividindo o desvio padrao 
fH .ti ni/T k uM{li.akim'3 la• i'tS'J.'IB 
da amostra (N): 4 



1.6.2 Intervalos de confianga © 

Lembre que normalmente estamos inte- 

ressados em utilizar a media da amostra como 
uma estimativa do valor da media verdadeira 
(isto e, da media da populagao). Acabamos de 
ver que amostras diferentes fornecerao valores 

diferentes da media e que podemos usar o erro 
padrao para ter uma ideia da extensao da dife- 

diferente para determinar a precisao da media 
da amostra como uma estimativa da media da 
populagao e cnl oMiaifiBii^lnillrt&to 

estara. Tais limites sao chamados de interva- 
ideia b£sica por tras r dos 
intervalos de confianga e construir uma gama 
de valores dentro dos quais achamos que o va¬ 
lor djgpopulagao estara 


4 De fato, ele deve ser o desvio padrao da populacao 
(cr), que e dividido pela raiz quadrada do tamanho da 
amostra; no entanto, para amostras grandes essa e uma 
aproximagao bastante boa. 


( - ; - 

Dica da Samanta Ferrinho 





V. 


Resumindo, o erro padrao e o desvio padrao das medias das amostras. Como 
tal, ele e uma medida de quao representativa a amostra podera ser da popula¬ 
gao. Um erro padrao grande (comparado a media da amostra) informa que exis- 
te muita variabilidade entre as medias das diferentes amostras e, dessa forma, a 
amostra que temos pode nao ser representativa da populagao. Um erro padrao 
pequeno indica que muitas medias amostrais sao similares (estao proximas) a 
media da populagao e, assim, a nossa amostra sera provavelmente uma boa 
representagao da populagao. 
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Vamos imaginar um exemplo: Domjan, 
Blesbois e Williams (1998) examinaram a li- 
beracao de esperma de uma codorna japonesa. 
A ideia basica e que se a codorna pode copular 
com a femea em um certo contexto (em uma 
camara experimental), entao esse contexto ira 
servir como uma deixa para a copula e isso ira 
afetar a liberacao do semen (embora durante 
a fase de testes a pobre codorna foi induzida 
a copular com um pedago de pano com uma 
cabega embalsamada de uma femea fincada 
no topo - doentio, nao?). De qualquer modo, 
se olharmos a quantidade media de esperma- 
tozoides liberado na camera experimental, 
existe uma media verdadeira (a media na po- 
pulagao); vamos imaginar que sao 15 milhoes 
de espermatozoides. Agora, na nossa amostra 
real, poderemos constatar que a quantidade 
media de espermatozoide liberado foi de 17 
milhoes. Como nao conhecemos a media ver¬ 
dadeira, realmente nao sabemos se o valor da 
nossa amostra de 17 milhoes e uma estimativa 
boa ou ruim desse valor. O que podemos fa- 
zer e usar um intervalo de estimativas: usamos 
nosso valor amostral como ponto do meio, mas 
determinamos um limite inferior e um supe¬ 
rior. Assim, podemos dizer que o valor real da 
media de espermatozoide liberado e algo entre 
12 e 22 milhSes (note que os 17 milhoes estao 
exatamente entre esses valores). E claro, nesse 
caso, o valor real (15 milhoes) esta entre esses 
limites. Mas e se determinarmos limites nteno- 
res, por exemplo, se acharmos que os valores 
estao entre 16 e 18 milhoes (novamente, note 
que os 17 milhoes estao no meio)? Nesse caso, 
o intervalo nao content o valor real da media. 
Vamos imaginar que voce esta particularmen- 
te interessado no exemplo do espermatozoide 
da codorna japonesa e repetiu o experimento 
50 vezes usando diferentes amostras. Cada vez 
que voce realizou o experimento, construiu um 
intervalo em volta da media da amostra como 
acabei de descrever. A Figura 1.10 mostra esse 
cenario: os circulos representam a media para 
cada amostra com as linhas saindo de fora de¬ 
les representando os intervalos para essas me- 
dias. O valor real da media (a media da popu- 
lagao) e de 15 milhoes e e representada pela 
linha vertical. O primeiro aspecto a ser notado 


e que a maioria das medias das amostras e dife- 
rente da media real (isso e por causa da varia- 
gao da amostragem, como foi descrito na segao 
anterior). Em segundo lugar, embora a maio¬ 
ria dos intervalos contenha a media real (eles 
atravessam a linha vertical significando que 15 
milhoes de espermatozoides estao em algum 
lugar entre os limites mais altos e mais baixos), 
alguns nao content. 

Ate agora, evitei o assunto de como deve- 
mos calcular os intervalos. E crucial construir 
os intervalos de confianga de uma maneira 
que eles nos informem algo util. Portanto, nos 
os calculamos de uma forma que eles tenham 
certas propriedades: especificamente, que eles 
nos indiquem a probabilidade de conterem o 
valor real do que estamos tentando estimar 
(nesse caso, a media). 

Tipicamente, se prestarmos atencao aos 
intervalos de confianga de 95% e, algumas 
vezes, aos intervalos de confianca de 99%, ve- 
remos que eles tern interpretagoes semelhan- 
tes: sao limites construfdos para que em certa 
percentagem das vezes (seja 95% ou 99%) o 
valor real da media da populagao esteja den- 
tro desses limites. Assim, quando voce tiver 
um intervalo de confianca de 95% para uma 
media, pense nele assim: se selecionarmos 
100 amostras, calcularmos a media e, depois, 
determinarmos o intervalo de confianca para 
aquela media (parecido com a Figura 1.10), 
95% dos intervalos de confianca conterao o 
valor real da media da populacao. 

Para calcular o intervalo de confianga, 
precisamos saber os limites nos quais 95% das 
medias estarao. Como calculamos esses limi¬ 
tes? Lembre-se da segao 1.5.3, onde eu disse 
que 1,96 era um valor de z importante (um es- 
core de uma distribuigao normal com uma me¬ 
dia 0 e um desvio padrao 1) porque 95% dos 
escores-z estao entre —1,96 e 1,96. Isso signifi- 
ca que se a nossa media da amostra tern media 
0 e erro padrao 1, os limites de nosso intervalo 
de confianga serao —1,96 e +1,96. Voce deve 
tambem lembrar que podemos converter esco- 
res em escores-z usando esta equagao: 

X-X 

z = - 
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Estes intervalos 
nao contem o 
"verdadeiro" 
valor da media 


Espermatozoides (milhoes) 

Figura mostrando intervalos de confianga da contagem de espermatozoides da co- 
sa (eixo horizontal) para 50 diferentes amostras (eixo vertical). 


:rmos que nossos limites serao 
em escores-z, quais sao os esco- 
identes em valores dos nossos da¬ 


dos? Para encontrar isso, podemos recolocar z 
na equagao (porque existem dois valores, nos 
temos duas equagoes): 
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1 1 t-' u 

s s 

O que precisamos saber e o valor de X 
nessas equagoes e, para descobrir isso, nos 
simplesmente as reorganizamos: 

1,96 X s = X — X —1,96 X s = X — X 

1,96 Xs + X = X -1,96 Xs + X = X 

Portanto, o intervalo de confianga pode ser 
facilmente calculado uma vez que o desvio pa¬ 
drao (s nas equagoes acima) e a media (X nas 
equates) sao conhecidos. Na verdade, usamos 
o erro padrao e nao o desvio padrao porque es- 
tamos interessados na variabilidade das medias 
das amostras e nao na variabilidade das obser- 
vagoes dentro da amostra. O limite mais baixo 
do intervalo de confianga e, portanto, a media 
menos 1,96 vezes o erro padrao e o limite supe¬ 
rior e a media mais 1,96 erros padrao. 

Limite inferior do intervalo de confianga 
= X- (1,96 xEP) 

Limite superior do intervalo de confianga 
= X + (1,96 x EP) 

Assim, a media esta sempre no centra do 
intervalo de confianga. Se a media representa 
com precisao a media real, o intervalo de con¬ 
fianga devera ser pequeno. Porque 95% dos in¬ 
tervals de confianga content a media real, po- 
demos assumir que esse intervalo de confianga 
content a media real: portanto, se o intervalo e 
pequeno, a media da amostra deve estar perto 
da media real. Ja se o intervalo de confianga e 
muito grande, entao a media da amostra devera 
ser diferente da media real, indicando que ela e 
uma pessima representante da populagao. Voce 
vera que os intervalos de confianga aparecerao 
frequentemente ao longo do livro. 

1.7 MODELOS LINEARES © 

A media e um exemplo de um modelo es- 
tatfstico, mas voce pode perguntar que outros 
tipos de modelos estatfsticos podem ser cons- 
trufdos. Bern, verdade seja dita, ha somente 


um modelo geralmente 
usado, conhecido como 
modelo linear. Para al- 
guns cientistas sociais, 
pode nao ser obvio 
que minha afirmagao 
anterior esta corre- 
ta, mas um estatfstico 
concordaria comigo 
prontamente. A razao 
para isso e que ha uma variedade de nomes 
diferentes dados aos procedimentos estatfs¬ 

ticos que sao baseados no modelo linear. Um 
exemplo classico e que a analise de variancia 

(ANOVA) e a regressao sao sistemas identicos 

(Cohen, 1968), mas eles tern nomes diferentes 
e sao usados em contextos diferentes (devido a 
uma divisao nas filosofias metodologicas - ver 

Cronbach, 1957). 

A palavra linear literalmente significa 
“relativo a uma linha”, mas em termos esta¬ 
tfsticos, a linha referida e uma linha reta. Urn 
modelo linear e, portanto, urn modelo baseado 
sobre uma linha reta; isso significa que geral¬ 

mente estamos tentando resumir nossos dados 
observados em temos de uma linha reta. Por 
exemplo, no capftulo descrevendo regressao, 
ficara claro que duas variaveis podem ser ne- 
gativamente relacionadas (isso significa que a 
medida os valores de uma variavel aumentam, 
valores de outra variavel diminuem). Em tais 
circunstancias, o relacionamento pode ser re- 
sumido por uma linha reta. 

Suponha que nos mensuramos quantos 
capftulos deste livro uma pessoa leu e, entao, 
medimos seu enriquecimento espiritual; po- 
demos representar esses dados hipoteticos na 
forma de um diagrama de dispersao no qual 
cada ponto representa um escore individual 
em ambas variaveis. A Figura 1.11 mostra tal 
grafico e tambem mostra o mesmo grafico, 
mas com uma linha que resume o padrao des¬ 
ses dados. Uma terceira versao do diagrama 
de dispersao e tambem inclufda, mas tern uma 
curva para resumir o padrao geral dos dados. A 
Figura 1.11 ilustra como podemos adequar di¬ 
ferentes tipos de modelos aos mesmos dados. 
Nesse caso podemos usar uma linha reta para 
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Numero de Capitulos Numero de Capitulos 

Figura 1.11 Diagramas de dispersao de alguns dados sem um modelo, com um modelo linear e 
um com um modelo nao-linear ajustados. 


representar nossos dados e ela ira mostrar que 
quanto mais capitulos uma pessoa ler, menor 
sera o seu enriquecimento espiritual. Entretan- 
to, tambem podemos usar uma linha curva para 
resumir os dados e isso mostrara que quando a 
maioria ou todos os capitulos foram lidos, o 
enriquecimento espiritual aumentara levemen- 
te (provavelmente porque uma vez que o livro 
for lido, tudo repentinamente faz sentido - 
imagine!). Nenhum dos dois tipos de modelos 
e necessariamente correto, mas existem casos 
em que um modelo representa melhor os dados 


do que outro. Assim, quando usamos modelos 
estatlsticos e importante avaliar quao bem um 

determinado modelo adere aos dados. 

A maioria da estatfstica usada nas ciencias 
sociais e baseada em modelos lineares, o que 
significa que tentamos adequar modelos de 
linhas retas aos dados coletados. Isso e inte- 
ressante porque a maioria dos estudos cientf- 
ficos publicados sao aqueles com resultados 
estatlsticos significantes. Dado que a maioria 
dos cientistas sociais aprende a usar somente 
tecnicas baseadas no modelo linear, os resulta- 
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dos publicados serao aqueles que utilizarem os 
modelos lineares com sucesso. Dados que se 
ajustam a padroes nao-lineares provavelmente 
serao erroneamente ignorados (porque o mo- 
delo errado teria sido aplicado aos dados, le- 
vando a resultados nao-significantes). Por essa 
razao, bons pesquisadores primeiro represen- 
tam seus dados graficamente; diagramas dos 
dados nos dizem muito sobre quais modelos 
podem ser aplicados aos dados. E possrvel, 
portanto, que algumas areas da ciencia estejam 
sendo tendenciosas; se voce coletar dados que 
parecerem nao-lineares, por que nao corrigir a 
tendencia e investigar tecnicas estatfsticas di- 

ferentes (o que e facil para eu dizer quando nao 
coloco tais tecnicas no meu livro!)? 

1.8 COMO DESCOBRIR SE 0 SEU 
MODELO REPRESENTA 0 MUNDO 
REAL? © 

Ate agora, vimos que usamos amostras 
para estimar o que esta acontecendo em uma 
populacao grande a qual nao temos acesso. Vi¬ 
mos, tambem, que e importante estabelecer se 
um modelo e bom ou ruim para os dados e se 


ele e representativo da populacao. Expliquei 
tudo isso usando a media como um exemplo, 
mas o que acontece quando nosso modelo e 
mais complicado? Cientistas estao geralmen- 
te interessados em cenarios mais complexos, 
como “existe uma relagao entre o monte de 
bobagens que as pessoas falam e o monte de 
gelatina de vodka que elas comeram?” ou “a 
quantidade media de chocolate que eu como 
quando estou escrevendo o livro e maior do 
que quando nao estou escrevendo?”. Nesses 
casos, adequamos modelos que sao mais com¬ 
plexos: na verdade, estamos detectando efei- 
tos na nossa populagao e quantificando esses 
efeitos. Esta segao explica algumas maneiras 
de quantificar efeitos e decidir se eles sao sig- 

nificativos. Essencialmente, esse e um proces- 

so de quatro estagios (veja o Quadro 1.1): 

1. Crie uma hipotese (ou hipoteses) - isso 

sera, geralmente, uma previsao de que al- 

gum tipo de efeito existe na populacao. 

2. Colete alguns dados uteis. 

3. Ajuste um modelo estatlstico aos dados - 

esse modelo ira testar suas previsoes ori¬ 

ginals. 


Quadro 1.1 


Fraude em pesquisa © 

0 processo de quatro estagios descrito neste capitulo funcionara somente se voce seguir os 
passos sem falcatruas. Suponha que eu quero apostar em quem vencera a Copa do Mundo de 
Rugbi. Como sou ingles, apostarei que a Inglaterra vencera o torneio. Para fazer isso eu: 

1. Fago minhas apostas, escolhendo meu time (Inglaterra) e as chances disponiveis na loterica 
(atualmente 6/4). 

2. Vejo qual time vence o torneio. 

3. Coleto meus ganhos (se a Inglaterra veneer). 

Para todos ficarem felizes, esse processo precisa ser justo: as lotericas determinam suas 
chances de modo que nao paguem muito (o que as torna felizes), mas as vezes paguem algo 
(para manter os clientes felizes). A loterica pode oferecer qualquer chance antes de o torneio ter- 
minar, mas nao pode muda-las depois que o torneio acabar (ou o ultimo jogo iniciou). Da mesma 
forma, posso escolher qualquer time antes do torneio, mas nao posso mudar de ideia no meio 
do torneio ou no final do jogo! 

{Continua) 
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Quadro 1.1 ( Continuaqao) 


A situagao na pesquisa e semelhante: podemos escolher qualquer hipotese (time de rugbi) 
que queremos antes de os dados serem coletados, mas nao podemos mudar de ideia no meio 
da coleta dos dados (ou apos a sua coleta). Da mesma forma, temos que decidir nosso nivel de 
probabilidade (ou chances de apostas) antes de coletarmos os dados. Se fizermos isso, o proces- 
so de quatro estagios funciona. Entretanto, pesquisadores as vezes fraudam. Eles nao escrevem 
suas hipoteses antes de conduzirem seus experimentos e, algumas vezes, eles as trocam quan- 
do os dados sao coletados (como eu, trocando meu time depois que a Copa do Mundo terminou) 
ou, pior ainda, decidem sobre elas depois de coletar os dados! Com excegao de alguns procedi- 
mentos complicados chamados de testes post hoc, isso e fraude. Do mesmo modo, pesquisado¬ 
res sao culpados se escolherem o nivel de significance depois de os dados terem sido coletados 
e analisados, assim como a loterica que muda as chances depois do torneio. 

Cada vez que voce trocar sua hipotese ou os detalhes da sua analise, aumenta a chance de 
encontrar um resultado significativo, mas voce tambem aumenta a probabilidade de publicar 
resultados que outro pesquisador nao conseguira reproduzir (o que e muito constrangedor). Se, 
entretanto, voce seguir cuidadosamente as regras e fizer seu teste com uma significance de 5%, 
pelo menos sabera que no maximo um resultado em cada 20 podera sair errado. 

(Agradecimentos a David Hitchin por esse quadro - pego desculpas por torna-lo em um 
exemplo de rugbi I). 


4. Avalie esse modelo para ver se ele suporta 
suas previsoes iniciais. 

Cientistas, em geral, estao interessados 
em testar hipoteses; isto e, testar as questoes 
cientfficas que eles criam. Dentro dessas 
questoes ha, usualmente, a previsao que um 
pesquisador fez. Essa previsao e chamada de 
hipotese experimental (ela e a previsao de 
que sua manipulagao experimental tera al- 
gum efeito ou que de certas variaveis irao se 
relacionar entre si). A possibilidade contraria 
- que sua previsao esta errada e que o efeito 

previsto nao existe - e chamada de hipotese 

nula. Dois exemplos sao: 

1. Hcimburgueres engordcun: a hipotese ex¬ 
perimental e que quanto mais hamburgue- 
res voce comer, mais parecido com uma 
baleia voce vai ficar; a hipotese nula e que 
as pessoas irao ficar gordas independen- 
temente da quantidade de hamburgueres 
que comerem. 

2. Queijo dd pesadelos : a hipotese experi¬ 
mental e que aqueles que comem queijo 
antes de dormir tern mais pesadelos do que 
quern nao come; a hipotese nula seria que 


quem come queijo antes de dormir tem 
mais ou menos o mesmo numero de pesa¬ 
delos do que aqueles que nao. (No caso de 
voce estar interessado, eu frequentemente 
como queijo antes de dormir e nao tenho 
pesadelos - exceto quando estou escre- 
vendo livros de estatfstica e sonho que sou 
atormentado por um numero mau.) 

Uma grande parte deste livro aborda a es¬ 
tatfstica inferencial, que informa se a hipotese 
experimental pode ser verdadeira - ela nos 
ajuda a confirmar ou rejeitar nossas previsoes. 
Grosso modo, aplicamos nosso modelo esta- 
tfstico aos nossos dados e observamos quao 
bem ele se encaixa nos mesmos (em termos 
de quanta variancia ele explica). Se ele se 
ajusta bem aos dados (isto e, explica muito da 
variancia dos escores), assumimos que nossa 
previsao inicial e verdadeira: aceitamos a hi¬ 
potese experimental. E claro, nunca podemos 
ter absoluta certeza de que qualquer hipotese 
esta correta e, portanto, trabalhamos com pro- 
babilidades. Mais precisamente, calculamos a 
probabilidade de que os resultados que obtive- 
mos ocorreram por acaso - a medida que essa 
probabilidade diminui, confirmamos que a hi- 
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potese experimental e correta e que a hipotese 
nula pode ser rejeitada. 

Para ilustrar essa ideia, Fisher 5 (1925) des- 
creve um experimento projetado para testar a 
afinnacao de uma mulher de que ela conseguia 
determinar, provando uma xfcara de cha, se 
o leite ou o cha foi colocado primeiro na xi¬ 
cara. Fisher pensou que poderia dar a mulher 
algumas xfcaras de cha em que o leite fosse 
colocado primeiro e outras em que o leite fos¬ 
se colocado por ultimo e ver se ela conseguiria 
identifica-las corretamente. A mulher saberia 
que existiria um niimero igual de xfcaras com o 
leite colocado em primeiro lugar e por ultimo, 
mas nao saberia a ordem em que foi colocado. 
Se pegarmos a situa§ao mais simples na qual 
ha somente duas xfcaras, a mulher tern 50% 
de chance de adivinhar corretamente. Se ela 
realmente adivinhasse corretamente, nao pode- 
rfamos ter certeza de que ela realmente sabe a 
difercnca entre as xfcaras nas quais o leite foi 
colocado primeiro daquelas em que o leite foi 
colocado por ultimo, porque a maioria de nos 
poderia se sair bem nessa tarefa apenas adivi- 
nhando. Mas e se complicassemos as coisas 
colocando seis xfcaras? Existem 20 maneiras 
nas quais essas xfcaras podem ser arranjadas e 
a mulher somente adivinharia a ordem corre¬ 
ta uma vez em 20 (ou 5% das vezes). Se ela 
acertasse a ordem correta, estarfamos prova- 
velmente muito confiantes de que ela poderia, 
realmente, perceber a difercnca (e reverencia-la 
por seu apurado paladar). Se voce quer saber 
mais sobre Fisher e suas palhacadas de degusta- 
£ao de cha, veja Field e Hole (2003), mas, para 
os nossos propositos, o ponto e que somente 
quando havia uma pequena probabilidade de a 
mulher completar a tarefa do cha somente por 
sorte concluirfamos que ela tinha uma habilida- 
de genufna para detectar se o leite fora coloca¬ 
do na xfcara antes ou depois do cha. 

Nao e coincidencia eu ter escolhido o 
exemplo das seis xfcaras acima (onde a pro- 
vadora de cha tinha 5% de chance de acertar a 


5 Para saber mais sobre Fisher, visite o site http://www. 
economics.soton.ac.uk/staff/aldrich/fisherguide/ 
rafreader.htm. 


tarefa por adivinha^ao), porque Fisher sugeriu 
que somente quando estamos 95% certos de que 
um resultado e genufno (isto e, nao resultante 
do acaso) devemos aceita-lo como verdadeiro. 
6 Ou seja, se ha somente 5% de probabilidade 
de algo acontecer por acaso, podemos aceitar 
que e uma descoberta verdadeira - dizemos que 
e uma descoberta estatisticamente significativa 
(veja o Quadro 1.2 para entender melhor o que 
estatisticamente significativo quer dizer). Esse 
criterio de 95% de confianga forma a base da 
moderna estatistica, mas existe pouca justifica- 
tiva para esse valor alem do que Fisher disse; 
no entanto, como ele foi um sujeito muito inte- 
ligente, confiaremos no seu julgamento (Figura 
1.12). Todavia, algumas vezes quando olho para 
a minha estante cheia de resultados experimen- 
tais que tiveram uma significancia de somente 
93% de probabilidade, imagino quao diferente 
minha carreira seria se Fisher tivesse acordado 
aquele dia com um humor tipo 90%. 

Periodicos de pesquisas tem predisposicao 
a publicar resultados positivos (nos quais a hi- 



Figura 1.12 Ronald Fisher contemplando as 
consequencias de estabelecerp = 0,05. 


6 E claro, na realidade, ela pode nao ser verdadeira - es¬ 
tamos apenas preparados para acreditar que ela seja! 
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Quadro 1.2 


O que podemos ou nao concluir de um teste de significance estatistica © 

1. A importancia de um efeito: Ja vimos que a ideia basica portras do teste de hipoteses envol- 
ve a geragao de uma hipotese experimental e de uma hipotese nula, ajustar um modelo esta- 
tistico e avaliar aquele modelo com uma estatistica teste. Se a probabilidade de obter o valor 
da nossa estatistica teste por acaso for menor do que 0,05, entao, geralmente aceitamos a 
hipotese experimental como verdadeira: ha um efeito na populagao. Normalmente dizemos 
"existe um efeito significativo de...". Contudo, nao seja enganado pela palavra "significativo", 
porque mesmo que a probabilidade do nosso efeito ter ocorrido por acaso seja pequena 
(menor do que 0,05), isso nao quer dizer que o efeito e importante. Efeitos muito pequenos 
nao-importantes podem se tornar estatisticamente significativos somente porque um grande 
numero de pessoas foi usado no experimento (veja Field e Flole, p. 60). 

2. Resultados nao-significativos: Uma vez que voce calculou sua estatistica teste, voce cal- 
cula a probabilidade de que ela tenha ocorrido por acaso; se essa probabilidade e maior do 
que 0,05 voce rejeita sua hipotese experimental. Contudo, isso nao signifies que a hipotese 
nula e verdadeira. Lembre que a hipotese nula e que nao existe efeito na populagao. Tudo 
o que um resultado nao-significativo nos diz e que o efeito nao e grande o suficiente para 
nao ser outra coisa do que um resultado causal - ele nao nos diz que o efeito e 0. Como 
Cohen (1990) destaca, um resultado nao-significativo nunca deveria ser interpretado (apesar 
de sempre ser) como "nenhuma diferenga entre medias" ou "nenhuma relagao entre varia- 
veis". Cohen tambem destaca que hipotese nula nunca e verdadeira porque sabemos pela 
distribuigao de amostras (veja a Segao 1.6) que amostras ao acaso terao medias ligeiramen- 
te diferentes e, mesmo que essas diferengas sejam muito pequenas (isto e, uma media pode 
ser 10 e a outra 10.000001), elas sao diferentes. Na verdade, mesmo uma pequena diferenga 
seria considerada estatisticamente significante se uma amostra grande o suficiente fosse 
utilizada. Assim, testes de significance nunca nos dizem que a hipotese nula e verdadeira, 
porque ela nunca e! 

3. Resultados significativos: OK, podemos nao aceitar a hipotese nula como sendo verdadeira, 
mas podemos pelo menos concluir que ela e falsa quando nossos resultados sao significa¬ 
tivos, certo? Errado! Uma estatistica teste significativa e baseada em uma argumentagao 
probabillstica, com grandes limites do que podemos concluir. Novamente, Cohen (1994), 
que era um otimo escritor de estatistica, destaca que uma argumentagao formal se baseia 
em uma afirmagao inicial de um fato seguida por uma afirmagao sobre o atual estado dos 
assuntos e uma conclusao inferida. Este silogismo ilustra o que eu quero dizer: 

• Se um homem nao tern bragos ele nao pode tocar guitarra. 
o Este homem toca guitarra. 

o Portanto, este homem tern bragos. 

O silogismo inicia com uma afirmagao do fato que permite alcangar a conclusao final, porque 
voce pode negar que o homem nao tern bragos (o anterior), negando que ele nao pode tocar 
guitarra (o seguinte). Uma versao parecida de hipotese nula e: 

• Se a hipotese nula e correta, esta estatistica teste nao pode acontecer. 
o Esta estatistica teste aconteceu. 

o Portanto, a hipotese nula e falsa. 

Isso e otimo, mas a hipotese nula nao e representada dessa maneira porque ela e baseada 
em probabilidades. Ela deveria ser colocada da seguinte forma: 

• Sea hipotese nula esta correta, esta estatistica teste e pouco provavel. 
o Esta estatistica teste aconteceu. 

o Portanto, a hipotese nula e pouco provavel. 

(i Continua) 
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Quadro 1.2 ( Continuagao) 


Se voltarmos ao exemplo da guitarra, podemos ter uma afirmagao similar: 

• Se urn homem toca guitarra, provavelmente ele nao toca na banda Fugazi (isso e verdade 
porque ha milhares de pessoas que tocam guitarra, mas somente duas que tocam guitarra 
na banda Fugazi!). 
o Guy Picciotto toca na Fugazi. 

o Portanto, Guy Piciotto provavelmente nao toca guitarra. 

Isso deve parecer, espero, completamente ridiculo - a conclusao esta errada porque Guy 
Piciotto toca guitarra. Isso ilustra um erro comum em testes de hipoteses. De fato, testes de sig- 
nificancia nos permitem dizer pouco sobre a hipotese nula. 


potese experimental e apoiada) e, se Fisher ti- 
vesse acordado com um humor em 90% aquela 
manha, eu teria tido muito mais experimentos 
“com sucesso” e provavelmente seria vice-rei- 
tor da minha universidade agora (hum, talvez 
tenha sido melhor para minha universidade que 
ele tenha acordado com um humor de 95%!). 

1.8.1 Estatisticas teste © 

Entao, como sabemos que o nosso modelo 
e uma boa representagao do que esta aconte- 
cendo no mundo real? Quando selecionamos 
dados, esses dados irao variar (vimos como 
medir essa variancia na Segao 1.4.1) Ha dois 
tipos de variancia (veja tambem o Capftulo 7): 

• Variagao sistematica: Essa variagao se 
deve a um efeito genulno (seja um efeito 
de um pesquisador fazendo algo a todos os 
participantes de uma amostra, mas nao em 
outras, ou a variagao natural entre conjun- 
tos de variaveis). Voce pode pensar nisso 
como uma variagao que pode ser explica- 
da pelo modelo que ajustamos aos dados. 

• Variagao nao-sistematica: E uma variagao 
que nao se deve ao efeito em que estamos 
interessados (assim, pode ser devido a dife- 
rengas naturais entre pessoas em diferentes 
amostras, como diferengas de inteligencia 
e motivagao). Voce pode pensar nisso como 
uma variagao que nao pode ser explicada 
pelo modelo que ajustamos aos dados. 

Se estivermos tentando estabelecer se um 
modelo e uma representagao razoavel do que 


esta acontecendo na populagao, geralmente 
calculamos uma estatistica teste. Uma estatisti¬ 
ca teste e uma estatistica que tern propriedades 
conhecidas; nos sabemos a freqiiencia com que 
diferentes valores dessa estatistica ocorrem. Sa- 
bendo isso, podemos calcular a probabilidade 
de obter um determinado valor. Uma analogia 
usada por Field e Hole (2003) e a idade em que 
as pessoas morrem. Dados passados nos dizem 
a distribuigao da idade de morte. Por exemplo, 
sabemos que em media os homens morrem por 
volta dos 75 anos e essa distribuigao e bem pe- 
sada no topo; isto e, a maioria das pessoas morre 
com idade acima dos 50 anos e e muito inco- 
mum morrer por volta dos 20. Assim, frequen- 
cias da idade do falecimento em mais velhos sao 
muito altas, mas mais baixas em mais jovens. 
Desses dados seria possivel calcular a proba¬ 
bilidade de alguem morrer com certa idade. Se 
aleatoriamente pegarmos alguem e perguntar- 
mos sua idade, e for 53, poderiamos dizer qual a 
probabilidade de ele morrer antes do seu proxi¬ 
mo aniversario (mas provavelmente levariamos 
um soco!). Tambem, digamos que encontramos 
um homem com 110 anos; poderiamos calcu¬ 
lar qual e a probabilidade de ele ter vivido tanto 
(seria uma probabilidade muito pequena porque 
a maioria das pessoas morre antes de alcangar 
essa idade). A maneira como usamos estatisti¬ 
cas teste e muito similar: sabemos suas distri- 
buigoes e isso nos permite, uma vez calculada 
a estatistica teste, descobrir a probabilidade de 
achar um valor tao grande como o que temos. 
Assim, se calculassemos a estatistica teste e seu 
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valor fosse 110, poderfamos, entao, calcular a 
probabilidade de obter um valor tao grande. 

Assim, como calculamos essas estatfsticas 
testes? Isso depende de qual estatfstica voce esta 
usando (e como voce vera mais adiante neste li¬ 
vro, existem muitos: t, F e x 2 , para listar apenas 
tres). Entretanto, a maioria dessas estatfsticas 
representa essencialmente a mesma coisa: 

Variancia explicada 

Estatfstica _ pelo modelo 
teste Variancia nao-explicada 
pelo modelo 

A forma exata dessa equagao muda de 
teste para teste, mas essencialmente estamos 
comparando a quantidade da variancia expli¬ 
cada pelo modelo que adequamos aos dados 
a variancia que nao pode ser explicada pelo 
modelo (veja os Capftulos 5 e 7 para uma ex- 
plicagao mais detalhada). A razao por que essa 
proporgao e tao util e intuitiva: se nosso mode¬ 
lo e bom, esperamos que o numero de varian- 
cias que ele pode explicar seja maior do que o 
numero que ele nao pode explicar. Nesse caso, 
a estatfstica teste sera sempre maior do que 1 
(mas nao necessariamente significante). 

Dado que sabemos quao frequentemente 
diferentes valores dos testes estatfsticos ocor- 
rem por acaso, uma vez calculada uma estatfs¬ 
tica teste particular, podemos calcular a proba¬ 
bilidade de conseguir esse valor. Como vimos 
na segao anterior, esses valores de probabi¬ 
lidade nos dizem quao provavel e que nosso 
modelo, ou efeito, seja genufno e nao somente 
resultado do acaso. Quanto mais variagao nos¬ 
so modelo explicar (comparado com a varian¬ 
cia que ele nao pode explicar), maior sera o 
teste estatfstico e menor a possibilidade de ele 
ocorrer por acaso (como nosso homem de 110 
anos). Portanto, quanto maior a estatfstica tes¬ 
te, menor a probabilidade de eles ocorrerem. 
Quando essa probabilidade cai para abaixo 
de 0,05 (Criterio de Fisher), aceitamos isso 
como uma confianga suficiente para assumir 
que a estatfstica teste e assim grande porque 
nosso modelo explica um montante suficiente 
de variagoes para refletir o que realmente esta 
acontecendo no mundo real (a populagao). Em 


outras palavras, aceitamos nossa hipotese ex¬ 
perimental e rejeitamos nossa hipotese nula - 
contudo, o Quadro 1.2 explica alguns mal-en- 
tendidos comuns sobre este processo. 

1.8.2 Testes uni e bilaterais © 

Quando usamos testes estatfsticos ou te- 
mos uma previsao especfftca do que ira acon- 
tecer, como “quanto mais alguem ler este livro 
maior a sua vontade de matar o autor”, ou real¬ 
mente nao sabemos o que ira acontecer, como 
“ler mais deste livro podera aumentar ou dimi- 
nuir o desejo do leitor de matar o autor”. O pri- 
meiro exemplo e direcionado: explicitamente 
dissemos que as pessoas iriam querer me matar 
a medida que lessem o livro. Se testarmos essa 
hipotese estatisticamente, o teste e chamado 
de teste unilateral. A segunda hipotese nao 
e direcionada: afirmamos que o desejo de me 
matar ira mudar por causa da leitura do livro, 
mas nao dissemos se esse desejo ira aumentar 
ou diminuir. Se testarmos essa hipotese estatis¬ 
ticamente, esse teste sera bilateral. 

Suponha que queremos descobrir se ler este 
livro aumenta ou diminui o desejo de me matar. 
Poderfamos fazer isso (experimentalmente) pe- 
gando dois grupos, um que leu o livro e outro 
que nao leu, ou (correlacionalmente) medin- 
do o montante do livro que foi lido e o desejo 
correspondente de me matar. Se nao tivermos 
uma hipotese direcional, ha tres possibilidades. 
(1) As pessoas que leram este livro querem me 
matar mais do que as que nao o leram, assim, 
a diferenga (a media dos que leram o livro me- 
nos a media dos que nao leram) e positiva. Em 
correlagao, quanto mais voce ler o livro, mais 
voce ira querer me matar - uma relagao positi¬ 
va. (2) As pessoas que leram este livro querem 
me matar menos do que as que nao leram, as¬ 
sim, a diferenga (a media das pessoas que es- 
tao lendo o livro menos a das que nao leram) 
e negativa. Em correlagao, quanto mais voce 
ler o livro, menor o seu desejo de me matar - 
uma relagao negativa. (3) Nao ha diferenga no 
desejo de me matar entre leitores e nao-leitores 
- a media dos leitores menos a media dos nao 
leitores e exatamente zero. Em correlagao, nao 
ha relagao entre ler este livro e a vontade de me 
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matar. Essa ultima opgao e uma hipotese nula. A 
diregao da estatistica teste (isto e, se e positiva 
ou negativa) depende se a diferenga e positiva 
ou negativa. Assumindo que ha uma diferenga 
positiva ou um relacionamento (ler este livro faz 
com que voce queira me matar), entao, para de- 
tectar essa diferenga temos que levar em conta o 
fato de que a media para leitores e maior do que 
para nao-leitores (e assim obtemos uma estatis¬ 
tica teste positiva). Entretanto, se fizemos uma 
previsao incorreta e ler este livro faz com que 
leitores queiram me matar menos, a estatistica 
teste sera realmente negativa. 

Quais as conseqiiencias disso? Bern, se no 
nlvel 0,05 precisassemos ter uma estatistica 
teste maior do que, por exemplo, 10, e o que 
realmente temos e — 12, entao rejeitarfamos 
a hipotese mesmo que uma diferenga exista. 
Para evitar isso, podemos olhar os dois lados 
(ou caudas) da distribuigao de posslveis esta- 
tlsticas teste. Isso significa que iremos pegar 
ambas as estatlsticas teste, negativas ou positi- 
vas. Entretanto, fazer isso tem um prego, pois, 
para manter nosso criterio de probabilidade em 
0,05, devemos dividir essa probabilidade entre 
as duas caudas: assim, temos 0,025 no lado po- 
sitivo da distribuigao e 0,025 no lado negativo. 
A Figura 1.13 mostra essa situagao - as areas 


escurecidas sao as areas acima do necessario 
para o teste estatlstico ao nlvel 0,025 de signi- 
ficancia. Combine as probabilidades em ambos 
os lados e voce tera 0,05 - nosso criterio de 
valor. Agora, se fizemos uma previsao, colo- 
camos todos nossos ovos em uma cesta e olha- 
mos somente para o final da distribuigao (ou 
para o lado positivo ou o negativo, dependendo 
na diregao da previsao que fizemos). Conse- 
quentemente, podemos apenas procurar pelo 
valor de uma estatistica teste que ocorreria por 
acaso com a uma probalidade de 0,05. Na Fi¬ 
gura 1.13, as linhas diagonals mostram a area 
acima da estatistica teste positiva necessaria ao 
nfvel 0,05 de significancia. O ponto importan- 
te e que se fizermos uma previsao especlfica, 
precisamos de uma estatistica teste menor para 
encontrar um resultado significativo (porque 
estamos procurando somente em uma cauda), 
mas se nossa previsao esta na diregao errada, 
nao conseguiremos detectar o efeito que real¬ 
mente existe! Nesse contexto, e importante 
lembrar o que foi dito no Quadro 1.1: voce nao 
pode apostar ou mudar sua aposta depois que 
o torneio terminar - se voce nao fez a previsao 
da diregao antes de coletar os dados, sera tarde 
demais para prever a diregao e reivindicar as 
vantagens do teste unilateral. 
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Teste estatistico 


Figura 1.13 Diagrama para mostrar a diferenga entre testes uni e bilaterais. 
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1.8.3 Erros do tipo I e do tipo II © 

Usamos testes estatlsticos para nos infor- 
mar sobre o estado real do mundo (a certo grau 
de confianga). Especificamente, estamos tentan- 
do ver se existe um efeito na nossa populagao. 
Temos duas possibilidades no mundo real: exis¬ 
te, na realidade, um efeito na populagao, ou nao 
existe, na realidade, efeito na populagao. Nao 
temos como saber quais dessas possibilidades 
sao verdadeiras: entretanto, podemos olhar as 
estatlsticas teste e suas probalidades associadas 
para descobrir qual dos dois e mais provavel. 
Obviamente, e importante que sejamos o mais 
preciso possivel, por isso Fisher afirmou que 
devemos ser muito conservadores e somente 
acreditar que o resultado e verdadeiro quando 
estivermos 95% confiantes de que ele e - ou 
quando houver somente 5% de chance de que os 
resultados possam ocorrer por acaso. Existem 
dois erros que podemos cometer: erro do Tipo I 
e erro do Tipo II. O erro do Tipo I ocorre quan¬ 
do acreditamos que ha um efeito verdadeiro na 
nossa populagao e, de fato, nao ha. Se usarmos o 
criterio de Fisher, a probabilidade de erro e 0,05 
(ou 5%) quando nao existe efeito na populagao 
- esse valor e conhecido como rn'vel de signifi- 
cancia e sua probabilidade e representada por a. 
Assumindo que nao ha efeito na populagao, e 
se reproduzirmos nossa colegao de dados 100 
vezes, poderfamos esperar que em cinco oca- 
sides obtivessemos uma estatistica teste grande 
o suficiente para nos fazer pensar que ha um 
efeito genulno na populagao mesmo que ele nao 
exista. O oposto e o erro do Tipo II, que ocorre 
quando acreditamos que nao exista um efeito na 
populagao, mas na realidade, ele existe. Isso ira 
ocorrer quando obtivermos um valor da estatis¬ 
tica teste pequeno (talvez porque exista muita 
variagao natural entre nossas amostras). Em 
um mundo ideal, queremos que a probabilidade 
desse erro seja bem pequena (se existe um efeito 
na populagao entao e importante que possamos 
detecta-lo). Cohen (1992) sugere que a probabi¬ 
lidade maxima aceitavel para um erro do Tipo 
II seria 0,2 (ou 20%) - isso e denominado de 
nlvel-/!. Isso significa que, se tomassemos 100 
amostras de dados da populagao na qual um 
efeito existe, falharfamos em detectar esse efei¬ 


to em 20 dessas amostras (assim, perderlamos 1 
em 5 dos efeitos verdadeiros). 

Existe, obviamente, uma troca entre esses 
dois erros: se diminuirmos a probabilidade de 
aceitar um efeito como verdadeiro (isto e, tor- 
nar a menor), aumentamos a probabilidade de 
que rejeitaremos um efeito que realmente existe 
(porque somos muito rlgidos sobre o nlvel no 
qual aceitaremos um efeito como verdadeiro). A 
relagao exata entre o erro do Tipo I e o erro do 
Tipo II nao e direta porque eles estao baseados 
em diferentes suposigoes: para fazer um erro 
do Tipo I nao deve haver efeito na populagao, 
enquanto para fazer um erro do Tipo II vale o 
contrario (deve haver um efeito que perdemos). 
Assim, embora saibamos que a probabilidade 
de cometer um erro do Tipo I diminui a medida 
que a probabilidade de cometer um erro do Tipo 
II aumenta, a natureza exata do relacionamen- 
to e geralmente adivinhada pelo pesquisador 
com base em sua experiencia e conhecimento 
(Howell, 2002, p. 104-107, fornece uma otima 
explicagao sobre a troca entre erros). 

1.8.4 Tamanhos de efeito © 

A estrutura para 
testar se os efeitos 
sao verdadeiros que 
acabamos de apre- 
sentar apresenta al- 
guns problemas - a 
maioria deles foi ex- 
plicada brevemente 
no Quadro 1.2. O 
primeiro problema 
que encontramos foi saber quao importante um 
efeito e: apenas porque uma estatistica teste e 
significativa nao quer dizer que o efeito que 
ela mede e significativo ou importante. A solu- 
gao e medir o tamanho de efeito que estamos 
testando de uma maneira padronizada. Quan¬ 
do medimos o tamanho de um efeito (seja uma 
manipulagao experimental ou a forga do rela- 
cionamento entre variaveis), isso e conhecido 
como tamanho de efeito. O tamanho de efeito 
e simplesmente uma medida de magnitude pa¬ 
dronizada do efeito observado. O fato de que 
a medida e padronizada apenas significa que 
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podemos comparar os tamanhos dos efeitos 
por meio de diferentes estudos que mediram 
diferentes variaveis ou usaram medidas de 
escala distintas (assim, um tamanho de efeito 
baseado em velocidade de milesimos de se- 
gundos poderia ser comparado a um tamanho 
de efeito baseado em batimentos cardiacos). 
Muitas medidas do tamanho de efeito foram 
propostas, as mais comuns sao o d de Cohen e 
o coeficiente de correlacao r de Pearson (veja 
Field, 2001 e Capftulo 4). Muitos de voces es- 
tao familiarizados com o coeficiente de corre¬ 
lacao como uma medida da forca do relacio- 
namento entre duas variaveis (veja o Capftulo 

4); contudo, ela e tambem uma medida muito 
versatil da forca de um efeito experimental. E 
um pouco diffcil aceitar que o humilde coefi¬ 

ciente de correlacao tambem pode ser usado 
dessa maneira; entretanto, isso e somente por- 
que os estudantes aprendem sobre ele dentro 
de um contexto de pesquisa nao-experimental. 
Nao quero falar sobre isso agora, mas se voce 
ler os Capftulos 4, 7 e 8 entendera melhor (eu 
espero!) o que quero dizer. Pessoalmente, pre- 
firo o coeficiente r de correlacao de Pearson 

como uma medida do tamanho de efeito por- 

que ele esta limitado ao intervalo entre 0 (sem 

efeito) e 1 (um efeito perfeito). 7 

Tamanhos de efeito sao uteis porque eles 
dao uma medida objetiva da importancia de 
um efeito. Assim, nao importa qual e o efeito 
que voce esta procurando, quais as variaveis 
que foram medidas: sabemos que um coefi¬ 
ciente de correlacao 0 significa que nao exis- 
te efeito e um valor 1 significa que existe um 
efeito perfeito. Cohen (1988. 1992) estipulou 
o que e um efeito pequeno ou grande: 

• r = 0,10 (efeito pequeno): nesse caso, o 
efeito explica 1% da variancia total. 

• r = 0,30 (efeito medio): o efeito e res- 
ponsavel por 9% da variancia total. 


7 O coeficiente de correla§ao pode ter valores negativos 
(mas nao abaixo de —1), o que e util quando estamos 
medindo o relacionamento entre duas variaveis porque 
o sinal r nos diz sobre a diregao do relacionamento, 
mas em pesquisas experimentais o sinal r meramen- 
te reflete a maneira como os pesquisadores codificam 
seus grupos (veja o Capftulo 4). 


• r — 0,50 (efeito grande): o efeito e res- 
ponsavel por 25% da variancia total. 

Podemos usar essas diretrizes para acessar 
a importancia do nosso efeito (independente- 
mente da significance da estatistica teste). 
Entretanto, r nao e medido numa escala linear, 
assim, um efeito com r = 0,6 nao e duas vezes 
maior do que um com r = 0,3! A utilidade da 
estimativa do tamanho de efeito e tamanha que 

a American Psychological Association (APA) 

recomenda que todos os psicologos informem 

esses efeitos nos resultados de qualquer traba- 

lho publicado. Portanto, e um habito que vale 

a pena ter. 

Um ponto final a mencionar e que quando 
calculamos os tamanhos de efeito, nos os cal- 
culamos para uma determinada amostra. Quan¬ 
do olhamos as medias em uma amostra, vemos 
que as usamos para fazer inferences sobre a 
media de uma populacao inteira (que e o valor 
que realmente estamos interessados). O mesmo 
e verdadeiro sobre os tamanhos de efeito: o ta¬ 
manho de efeito na populacao e o valor no qual 
estamos interessados, mas porque nao temos 
acesso a esse valor, usamos o tamanho de efei¬ 
to na amostra para estimar o provavel tamanho 
de efeito na populatjao (veja Field, 2001). 

1.8.5 Poder estatlstico © 

Vimos que os tamanhos de efeito sao uma 
maneira inestimavel de expressar a importan¬ 
cia de uma descoberta na pesquisa. O tamanho 
de efeito em uma popula 9 ao e intrinsecamente 
ligado a tres outras propriedades estatisticas: 
(1) o tamanho da amostra no qual o tamanho 
de efeito da amostra e baseado; (2) o nivel da 
probabilidade no qual aceitaremos que um 
efeito e estatisticamente significativo (mvel a); 
(3) a habilidade de um teste detectar um efei¬ 
to daquele tamanho (conhecido como o poder 
estatlstico). Assim, se conhecemos tres dessas 
propriedades, podemos calcular a que falta. 
Ira depender, tambem, se o teste e uni ou bi¬ 
lateral (veja a Segao 1.8.2). Tipicamente, em 
psicologia, usamos o nivel a em 0,05, assim, 
ja conhecemos esse valor. O poder de um teste 
e a probabilidade que um determinado teste ira 


























































58 Andy Field 


encontrar um efeito assumindo que um ja exista 
na populacao. Se voce refletir, ira lembrar que ja 
vimos a probabilidade de falhar em detectar um 
efeito que realmente existe (/J, a probabilidade 
de um erro Tipo II). Segue que a probabilidade 
de detectar um efeito, se um existe, deve ser o 
oposto da probabilidade de nao detectar aque- 
le efeito (isto e, 1 — ft). Tambem ja mencionei 
que Cohen (1988, 1992) sugere que deverla- 
mos esperar uma probabilidade 0,2 na falha em 
detectar um efeito verdadeiro e, assim, o nivel 
correspondente do poder que ele recomendou 
foi de 1,0 - 0,2 = 0,8. Nosso objetivo deve ser 
alcangar um poder de 0,8 ou 80% de probabili¬ 
dade de detectar um efeito se ele genuinamente 
existe. O tamanho de efeito na populapao pode 
ser estimado do tamanho de efeito em uma 
amostra e o tamanho da amostra e determina- 
do pelo pesquisador de qualquer modo, assim, 
o valor e facil de calcular. Agora, existem duas 
coisas uteis que podemos fazer sabendo que es- 
sas quatro variaveis estao relacionadas: 

1. Calcular o poder de um teste: Se con- 
duzirmos nosso experimento, ja teremos 
selecionado um valor de a, poderemos 
estimar o tamanho de efeito baseado na 
nossa amostra e saberemos quantos parti- 
cipantes usamos. Portanto, podemos usar 
esses valores para calcular f), o poder de 
nosso teste. Se esse valor for 0,8 ou mais, 
podemos garantir que alcanpamos poder 
suficiente para detectar qualquer efeito 
que podera ter existido, mas se o valor 
resultante for menor, deveremos refazer 
o experimento usando mais participantes 
para aumentar o poder. 

2. Calcular o tamanho da amostra neces- 
sario para alcan^ar um nivel dado de 
poder: Dado que sabemos o valor de a 
e /3, podemos utilizar pesquisas anterio- 
res para estimar o tamanho de efeito que 
esperamos detectar em um experimento. 
Mesmo que ninguem tenha previamente 
feito o experimento exato que voce pre- 
tende fazer, ainda assim podemos estimar 
a provavel tamanho de efeito baseados em 
experimentos similares. Podemos usar 
esse tamanho de efeito estimado para cal¬ 


cular quantos participantes necessitamos 

para detectar esse efeito (baseado nos va¬ 
lores de a e /3 que escolhemos). 

O ultimo uso e o mais comum: para deter- 
minar quantos participantes devem ser usados 
para alcancar o desejado nivel de poder. Os 
calculos exatos sao muito volumosos, mas, fe- 
lizmente, existem agora programas de compu- 
tadores disponlveis que os farao para voce (um 
exemplo e o G* Power que e gratis e pode ser 
encontrado no site www.artmed.com.br, outro 
e o nQuery Adviser - veja Field (1998b) para 
uma avaliacao - mas esse tern que ser compra- 
do!) Tambem, Cohen (1988) fornece tabelas 
extensas para calcular o numero de partici¬ 
pantes para um determinado nivel de poder (e 
vice-versa). Baseado em Cohen (1992), pode¬ 
mos usar as seguintes diretrizes: se tomarmos 
o nivel padrao a de 0,05 e requisitarmos o po¬ 
der recomendado de 0,8, entao precisamos de 
783 participantes para detectar um tamanho de 
efeito pequeno (r = 0,1), 85 participantes para 
detectar um tamanho de efeito medio (r = 0,3) 
e 28 participantes para detectar um tamanho 
de efeito grande (r = 0,5). 

1.9 ULTIM0S C0NSELH0S 

Quero terminar este capltulo com alguns 
conselhos gerais. Procedimentos estatlsti- 
cos sao uma forma de processar numeros e, 
portanto, se voce colocar baboseiras em uma 
analise mesmo assim obtera conclusoes que 
tern significado estatlstico, mas que provavel- 
mente nao terao sentido emplrico (pratico). 
Existe uma tenta^ao de ver a estatlstica como 
uma forma milagrosa de determinar a verda- 
de, mas a estatlstica e somente um recurso. 
Meu professor de estatlstica costumava dizer 
que se “voce entra com lixo, voce vai obter 
lixo”. Eu nunca havia entendido o que ele 
estava querendo dizer ate que as pessoas co- 
mecaram a me apresentar conjuntos de dados 
contendo milhSes de variaveis aleatorias apa- 
rentemente conectadas que eles queriam que 
eu as ajudasse a interpretar. Na analise esta¬ 
tlstica nao existe um substituto para o pen- 
samento emplrico! Tenha isso em mente ao 
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longo deste livro. Um ultimo conselho: nunca 
acredite em algo que um psicologo diga sobre 
estatistica. © 

1.10 0 QUE DESCOBRIMOS SOBRE 
ESTATISTICA? ® 

Ok, este foi o seu curso rapido de ini- 
ciagao a teoria da estatistica! Espero que seu 
cerebro ainda esteja relativamente intacto. O 
ponto principal que quero que voce entenda e 
que quando executa a sua pesquisa, voce estara 
querendo ver se algum efeito verdadeiro existe 
na populacao (o efeito procurado depende dos 
seus interesses de pesquisa e suas previsoes 
especificas). Voce nao sera capaz de coletar 
dados sobre toda a populagao (a menos que 
queira gastar toda a sua vida e provavelmente 
varias outras coletando dados), portanto, deve- 
ra utilizar amostras. Usando os dados da amos- 
tra, voce ajustara um modelo estatistico para 
testar suas previsoes, ou seja, detectar o efei¬ 
to de interesse. A estatistica resume-se a uma 
ideia simples: dados observados podem ser 
previstos a partir de algum tipo de modelo mais 
um erro associado a tal modelo. O modelo e 
usado (e normalmente o erro associado a ele) 
para calcular a estatistica teste. Se tal mode¬ 
lo pode explicar grande parte da variagao nos 
dados coletados (a probabilidade de obter essa 
estatistica teste e menor do que 5%), voce vai 
inferir que o efeito de interesse realmente exis¬ 
te na populacao. Se a probabilidade de obter tal 
estatistica teste e mais do que 5%, voce podera 
concluir que o efeito e muito pequeno para ser 
detectado. Em vez de confiar na significancia, 
voce pode quantificar o efeito na amostra de 
uma forma padrao como um tamanho de efeito 
e isso podera ser util para determinar a impor- 
tancia de tal efeito. Agora, para o SPSS! 


• Desvios 

• Distribuicao amostral 

• Distribuicao de probabilidade 

• Distribuicao normal 

• Erro do Tipo 1 

• Erro do Tipo 11 

• Erro padrao 

• Escore-z 

• Estatistica teste 

• Hipotese nula 

• Hipoteses experimentais 

- Distribuicao de freqiiencias 

- Histograma 

• Intervalo de confianca 

• Leptocurtica 

• Media 

• Moda 

• Modelo linear 

• Nivel a 

• Nivel ft 

• Platiciirtica 

• Poder estatfstico 

• Populacao 

• Soma dos erros ao quadrado (SS) 

• Tamanho de efeito 

• Teste bilateral 

• Teste unilateral 

• Variagao nao-sistematica 

• Variagao sistematica 

• Variancia 

1.12 QUESTOES DE REVISAO DO ALEX 
ESPERTO 


Alex Esperto sabe tudo so¬ 
bre estatistica e SPSS. Ele adora 
fazer perguntas sobre estatistica 
para os outros a fim de mostrar 
o quanto ele sabe. Que tal irrita- 
lo e responder corrctamente todas as questoes? 



1.11 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• Amostra 

• Assimetria 

• Curtose 

• Desvio padrao 


1. Por que utilizamos amostras? © 

2. O que e a media e como podemos saber se 
ela e representativa dos nossos dados? © 

3. Qual e a diferenga entre desvio padrao e 
erro padrao? © 

4. O que e uma estatistica teste e o que ela 
nos informa? © 
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5. O que sao os erros do Tipo I e do Tipo 

II© 

6. O que e o tamanho de efeito e como ele e 
mensurado? © 

7. O que e poder estatfstico? © 

Algumas respostas breves podem ser en- 
contradas no arquivo Answers (Chapter l).pdf 
dispomvel no site www.artmed.com.br. 

1.13 LEITURAS COMPLEMENTARES 

COHEN, J. Things I have learned (so far). 
American Psychologist, v. 45, n. 12, 1990. p. 
1304-1312. ' 


COHEN, J. The earth is round (p < .05). American 
Psychologist, v. 49, 1994. p. 997-1003. Alguns 
artigos maravilhosos do melhor escritor 
moderno de estatlstica. 

FIELD, A. P., Hole, G. J. How to design and report 
experiments. Londres: Sage, 2003. Sou suspeito 
para falar, mas acredito que esse livro traga um 
bom panorama da teoria estatlstica basica. 

WRIGHT, D. B. First steps in statistics. London: 
Sage. 2002. Capltulos 1, 4 e 5 sao introduces 
bem claras sobre amostragem, intervalos 
de confianqa e outras ideias estatlsticas 
importantes. 



2 

0 AMBIENTE DO SPSS 


2.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 

Espero que o Capftulo 1 nao o tenha feito 
desistir do livro. Se nao, o Capftulo 2 lida com 
outras informagoes que voce precisara saber: 
o ambiente do SPSS. Existem varios textos 
excelentes que fornecem uma introdugao ao 
ambiente de uma forma geral dentro do qual 
o SPSS opera. Os melhores incluem Kinnear 
e Gray (2000) e Foster (2001). Esses textos 
valem a pena ser lidos se voce nao possui fa- 
miliaridade com computadores e o SPSS. No 
entanto, eu tenho consideragao pela pouca 
grana de muitos estudantes e assim para tor- 
nar este texto util para aqueles que nao tern 
experiencia com o SPSS, esta secao fornece 
um guia para o ambiente do software - mas se 
voce precisa ir mais a fundo entao recomendo 
que veja os textos citados anteriormente e os 
manuais do SPSS (voce pode tambem achar 
os arquivos de ajuda (help) uteis). Este capf¬ 
tulo trata de janela base do SPSS (o editor de 
dados - data editor e visualizador - viewer) 
e tambem apresenta como criar variaveis, 
entrar com dados e ajustar propriedades das 
variaveis. Terminaremos vendo como carregar 
arquivos e salva-los! 


2.2 VERSOES DO SPSS © 

Este livro e baseado principalmente na 
versao 13.0 do SPSS (pelo menos em termos 
de diagramas); no entanto, nao se deixe im- 
pressionar muito pelos numeros das versoes 
porque a SPSS tem o habito de langar “novas” 
versoes regularmente. Embora isso os faga 
ganhar muito dinheiro e criar um bom merca- 
do para pessoas que escrevem livros sobre o 
recurso, existem na realidade poucas diferen- 
gas entre essas novas versoes e a maioria de 
nos nem ira percebe-las. Ocasionalmente eles 
apresentam uma grande mudanga (a versao 7.0 
mostrou uma mudanga dramatica em relagao a 
versao 6.0 e a versao 10.0 alterou a forma de 
entrada das variaveis), mas a maior parte do 
tempo voce pode se virar bem com um livro 
que nao cobre explicitamente a versao que 
voce esta utilizando (a primeira edigao desse 
livro foi baseado na versao 9, mas pode ser 
utilizado sem problemas com as versoes 7, 8, 
10, 11 e 12). Assim esse livro revisado, embo¬ 
ra lide com a versao 13.0, podera ser utilizado 
com versoes anteriores (7.0, 7.5 e 8.0 - existe 
algumas poucas diferengas entre as versoes 
7.0, 8.0 e 9.0, mas qualquer diferenga obvia 
esta destacada quando for relevante). Eu tam¬ 
bem suspeito que ele possa ser utilizado com 
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as versoes 14, 15 e 
16 quando elas apa- 
recerem (embora a 
SPSS possa decidir 
mudar tudo so para 
me contrariar!). 
Existem varias di- 
ferengas em termos 
da entrada de dados 
com as versoes an- 
teriores a 10 assim se estas utilizando a versao 
9 ou anterior em inclm um arquivo denomina- 
do de Field2000(Chapterl).pdf no site www. 
artmed.com.br. Esse arquivo e uma copia do 
Capftulo 1 da primeira edigao do livro e ira 
mostrar como entrar com dados nessas ver¬ 
soes mais antigas. 

2.3 INICIANDO © 

O SPSS utiliza principalmente duas ja- 
nelas: o editor de dados - data editor (que e 
o local onde se entra com os dados e se exe- 
cuta as fungoes estatlsticas) e o visualizador 
- viewer (que e onde os resultados de qual- 
quer analise irao ser apresentados). 1 Existem 
varias janelas adicionais que poderao ser ati- 
vadas como o editor de sintaxe - sintax editor 
(veja a Segao 2.6), que permite que se entre 
com comandos manualmente (em vez de se 
utilizar os menus baseados em janelas). Para 
a maioria dos nfveis de conhecimento a ja- 
nela de sintaxe e redundante, pois voce pode 
executar a maioria das analises simplesmen- 
te com o mouse. No entanto, existem muitas 
fungoes adicionais que podem ser acessadas 
utilizando-se a sintaxe e loucos que gostam de 
estatlstica podem encontrar muitos usos para 
ela. Apenas para provar que eu sou o mais lou- 
co de todos, existem umas poucas segoes onde 
eu irei forga-lo a usa-la. © 


1 Em versoes do SPSS anteriores a versao 7.0, os grafi- 
cos aparecem em uma janela separada conhecida como 
carrossel grafico - chart carousel ); no entanto, as ver¬ 
soes 7.0 e posteriores incluem os graficos na janela 
de safda, que e denominada de navegador de safda - 
output navigator (versao 7.0) e o visualizador de safda 
- output viewer (versao 8.0 e posteriores). 


Uma vez que o SPSS tenha sido ativado, 
uma janela inicial aparecera (veja a Figura 2.1), 
que permitira a selegao de varias opgoes. 2 Se 
voce ja tem um arquivo de dados guardado em 
algum disco que voce gostaria de abrir entao 
selecione Open an existing data source (Abrir 
uma fonte de dados existente) clicando no r de 
forma que ele aparega assim: 17 , essa e a opgao 
por omissao (default). No espago embaixo des- 
sa opgao existe uma lista dos arquivos abertos 
recentemente que voce podera selecionar com o 
mouse. Para abrir o arquivo selecionado clique 
em <* . Se voce quiser abrir um arquivo de da¬ 
dos que nao esta na lista selecione More files... 
(Mais arquivos) com o mouse e clique em <* I. 
Isso ira abrir a janela de exploragao padrao que 
permitira a navegagao pelos arquivos do com- 
putador para tentar encontrar o arquivo desejado 
(veja a Segao 2.8). Pode, tambem, ocorrer que 
voce queira abrir algo que nao seja um arquivo 
de dados, por exemplo, um documento viewer 
(visualizagao) contendo resultados da sua ulti¬ 
ma analise. Voce podera fazer isso selecionan- 
do Open another type of file (Abrir Outro Tipo 
de Arquivo) clicando no de forma que ele 
aparega assim: <*■ ; e escolhendo um arquivo da 
lista ou entao selecionando More files ... (Mais 
arquivos...) e navegando pelo computador. Se 
voce esta iniciando uma nova analise (como 
estamos fazendo aqui) entao queremos digitar 
nossos dados em um novo editor de dados. Para 
isso precisamos selecionar Type in data (Digite 
os dados) clicando novamente no e entao no 
<* . Isso ira abrir uma janela de edigao de da¬ 
dos ( data editor) em branco. 

2.4 0 EDITOR DE DADOS © 

A janela principal do SPSS inclui um 
editor para a entrada dos dados. Essa janela 
e onde a maioria da agao acontece. No topo 
dessa janela existe uma barra de menus seme- 
lhante a outras que voce ja deve ter visto em 


2 De fato, essa janela nao aparece em versoes anteriores a 
10.0. Em vez disto, um editor de dados em branco e car- 
regado e voce podera abrir os arquivos utilizando os me¬ 
nus (veja a secao 2.8 ou o arquivo Field2000(Chapterl). 
pdf no site www.artmed.com.br). 
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Figura2.1 A janela inicial do SPSS. 


outros programas (tal como o Word). A figu- 
ra 2.2 mostra essa barra de menu e o editor 
de dados. Existem varios menus no topo da 
tela (por exemplo, File (Arquivo), Edit (Edi- 
tar), etc.) que podem ser ativados pela utili- 
za 9 ao do mouse para mover o cursor sobre o 
menu desejado e entao pressionar o botao es- 
querdo uma vez (pressionar esse botao e nor- 
malmente conhecido como ‘clicar’). Quando 
voce clica em urn menu, uma janela se abre 
mostrando uma lista de opcodes que podem 
ser ativadas movendo o cursor para a opgao 
desejada e entao clicando-a. Frequentemente 
selecionar uma opgao do menu faz que uma 
nova janela apareca, essas janelas sao denomi- 
nadas de “caixas de dialogo” (dialog boxes). 
Quando me referir a oppoes selecionaveis de 
um menu eu irei representar a acao utilizando 


negrito com uma seta indicando o caminho do 
mouse (assim, cada seta representa colocar o 
cursor sobre a palavra e clicar com o botao es- 
querdo do mouse). Por exemplo, se eu quiser 
dizer que voce deve selecionar a op 9 ao Save 
As... (Salvar Como) do menu File (Arqui¬ 
vo), escreverei isso como File=>Save As... 
(Arquivo=>Salvar Como). 

O editor de dados tern dois paineis (views): 
o de dados e o de variaveis. O editor de dados 
e para entrar obviamente dados e o editor de 
variaveis permite que definamos varias carac- 
teristicas das variaveis do editor de dados. 3 Na 


3 Antes do SPSS versao 10, a entrada de dados era feita 
utilizando um unico painel (veja Field, 2000, Capitulo 
1 que esta disponfvel site www.artmed.com.br como 

Field2000(Charpterl).pdf). 
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A caixa preta 
mostra que essa 
celula esta ativa 

V 


Mostra o valor da 
celula que esta ativa 



Figura 2.2 0 editor de dados do SPSS (versao 10 em diante). 


parte de baixo do editor de dados, voce pode 
observar que existem duas orelhas (tabs) de- 
nominadas como Data View (Painel de Da¬ 
dos) e Variable View (Painel de Variaveis) 

(<l>l \ Palatum / Variable View / ) e tudo O que teUlOS 

que fazer para passar de um para outro e clicar 
com o mouse. Se estivermos no editor de dados 
entao essa orelha tera um fundo branco e o pai¬ 
nel das variaveis sera cinza e se estivermos no 
painel das variaveis entao o oposto ira ocorrer. 
Primeiro, vamos dar uma olhada em algumas 
caracterfsticas do editor de dados, essas sao 
caracterfsticas que nao se alteram quando nos 
mudamos de um painel para outro. Antes, va¬ 
mos veriftcar os menus. 

Em varios softwares dentro dos menus 
serao encontradas algumas letras sublinhadas, 
isso representa um “atalho de teclado” para fa- 
cilitar o acesso a tal funijao. E posslvel selecio- 
nar muitas fungoes sem a utiliza$ao do mou¬ 
se, e um usuario experiente pode achar esses 
atalhos mais rapidos que posicionar o mouse 
sobre o local adequado na tela. As letras subli¬ 
nhadas nos menus indicam que a opgao pode 
ser ativada pressionando simultaneamente Alt 
no teclado seguido da letra sublinhada. Assim 
para acessar a opcao Save As... (Salvar Como), 
utilizando apenas o teclado, voce deve pres- 
sionar Alt e F simultaneamente (que ira ativar 


o menu File - Arquivo)*; entao, mantendo a 
tecla Alt pressionada, pressione A que e letra 
sublinhada em Save As.... No SPSS 13.0 (pelo 
menos quando estiver rodando no Windows 
XP), essas letras sublinhadas nao sao vislveis, 
no entanto, voce ainda pode utilizar os atalhos 
de teclado. Se voce pressionar Alt entao as 
letras sublinhadas se tornarao vislveis, e uma 
vez pressionada a tecla Alt voce pode apenas 
pressionar as letras sublinhadas para navegar 
pelos menus. Desta forma, ao longo do livro, 
eu incluirei as letras sublinhadas para os leito- 
res que quiserem utilizar os atalhos de teclado, 
mas para aqueles, exceto voce, que nao que- 
rem, tentem nao ser desestimulados pelas letras 
sublinhadas no livro! 

Abaixo um guia breve de referenda para 
cada um dos menus e algumas das opgbes que 
eles content. Isso e meramente um resumo 
e descobriremos as caracterfsticas de cada 
menu conforme formos progredindo ao longo 
do texto. 

• File (Arquivo): Esse menu permite fazer 

coisas gerais tais como salvar arquivos, gra- 


* N. de T. Evidentemente, se o software estiver tradu- 
zido, para se ativar o menu Arquivo , sera necessario 
pressionar Alt + A. 
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ficos ou safdas de analise. Da mesma forma, 
pode-se abrir arquivos ja salvos e imprimir 
graficos, dados ou safdas. Em resumo, ele 
contem todos as opgoes costumeiramente 
encontrados no menu File (Arquivo). 

• Edit (Editar): Esse menu contem funcoes 
de cdicao para o editor de dados. No SPSS 
para Windows e possfvel recortar e colar 
blocos de numeros de uma parte do edi¬ 
tor para outro (que pode ser bastante util 
quando voce percebe que digitou montes 
de numeros no lugar errado). Voce pode, 
ainda, utilizar Options (Opines) para se- 
lecionar varias preferencias tais como as 
fontes que sao utilizadas nas safdas. As 
preferencias por omissao ( default ) sao 
boas para a maioria das situacoes; a unica 
coisa que voce pode querer mudar e o ta- 
manho da pagina de safda do visualizador 
colocando a opgao como infinito (isso sal- 
vara muitas arvores quando voce comecar 
a imprimir coisas). Para fazer isso voce 
precisa selecionar a orelha Viewer (Visua¬ 
lizador) no infcio da janela. 

• View (Exibir): Esse menu lida com espe- 
cificagoes do sistema tais como se o edi¬ 
tor apresentara linhas de grade, ou se voce 
apresentara os rotulos ( labels ) dos valores 
(exatamente o que sao rotulos se tornara 
claro mais tarde). 

• Data (Dados): Esse menu permite que 
se fagam alteragdes no editor de dados. 
As caracterfsticas importantes sao insert 
variable (inserir variavel), que e utilizada 
para inserir uma nova variavel no editor 
de dados (isto e, adicionar uma nova colu- 
na); insert case (inserir caso), que e utili- 
zado para inserir uma nova linha de dados 
entre duas ja existentes, split file (dividir 
arquivo), que e utilizado para dividir um 
arquivo por uma variavel de agrupamento 
(veja a Segao 3.4) e select cases (selecio¬ 
nar casos), que e utilizada para rodar uma 
analise utilizando somente uma amostra 
dos casos (valores). 

• Tranform (Transformar): Voce deve uti¬ 
lizar esse menu se quiser manipular uma 
das variaveis de alguma forma. Por exem- 


plo, voce pode utilizar recode (recodificar) 
para mudar os valores de certas variaveis 
(por exemplo, se voce quiser atribuir no- 
mes diferentes por alguma razao) - veja o 
Quadro 3.2. A fungao compute (calcular) 
e tambem util para transformar dados (por 
exemplo, para criar uma nova variavel que 
e a media de duas existentes). Essa fungao 
permite que se execute qualquer numero 
de modificagoes nas variaveis existentes 
(veja a Segao 3.3.4). 

• Analyze (Analisar): A diversao comega 
aqui, porque todos os procedimentos es- 
tatfsticos estao nesse menu. 4 A seguir, ha 
um breve guia das opgoes disponfveis que 
serao utilizadas durante o curso deste li- 
vro (isso e apenas uma pequena porgao do 
que esta disponfvel): 

(a) Descriptive Statistics (Estatistica 
Descritiva): 5 Esse menu serve para 
determinar medidas descritivas (me¬ 
dia, medidana, moda, etc.), frequen- 
cias e para uma exploragao geral dos 
dados. Existe ainda um comando 
denominado de crosstabs (tabulagao 
cruzada) que e util para explorar fre- 
quencias de dados e executar testes 
tais como o qui-quadrado, o exato de 
Fisher e o kappa de Cohen. 

(b) Compare Means: (Comparar Me- 
dias): Aqui e onde se podem encon- 
trar os testes t (para amostras relacio- 
nadas e independentes - Capftulo 7) e 
a ANOVA independente (Capftulo 8). 

(c) General Linear Model: (Modelo Li¬ 
near Generalizado): 6 Esse menu e 
para realizar Analises de Variancias 
complexas tais como a de dois fatores 
(relacionada, nao-relacionada ou mis- 
ta), a de um fator com medidas repe- 
tidas e a analise de variancia multiva- 


4 Esse menu e denominado de Statistics (Estatistica) na 
versao 8.0 ou anterior. 

5 Esse menu e denominado de Sumarize (Resumir) na 
versao 8.0 ou anterior. 

6 Esse menu e denominado de ANOVA Models (Modelo 
ANOVA) na versao 6 do SPSS. 
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riada (MANOVA) - veja os capitulos 
9, 10, 11, 12 e 14. 

(d) Correlate: (Correla^ao): Nao pre- 
cisa ser urn genio para perceber que 
e aqui que as tecnicas de correlagao 
sao encontradas! Voce podera execu- 
tar correlates bivariadas tais como 

o calculo do r de Pearson, o ro de 

Spearman (p) o tau de Kendall (r) 
bem como as correla£5es parciais 
(veja o capitulo 4). 

(e) Regression: (Regressao): Existe 
uma variedade de tecnicas de regres¬ 
sao disponiveis no SPSS. Voce po¬ 
dera executar uma regressao linear 
simples, uma multipla (Capitulo 5) e 
tecnicas mais avangadas tais como a 
regressao logistica (Capitulo 6). 

(f) Loglinear: (Loglinear): A analise 
loglinear esta escondida nesse menu, 
esperando por voce, e pronta para ata- 


car como uma tarantula de sua toca 
(Capitulo 16). 

(g) Data Reduction: (Reducao de da¬ 
dos): Voce encontrara a Analise de 
Fatores aqui (Capitulo 15). 

(h) Scale: (Escala): Aqui sera encontra- 
da a Analise de Confiabilidade (Capi¬ 
tulo 15). 

(i) Nonparametric Tests: (Testes nao-pa- 
rametricos): Existem uma variedade 
de estatisticas nao-parametricas dis¬ 
poniveis tais como o a estatistica de 
aderencia pelo qui-quadrado, o teste bi¬ 
nomial, o teste de Mann-Whitney, o de 
Kruskal-Wallis, Wilcoxon e a ANOVA 
de Friedman (Capitulo 13). 

• Graphs (Graficos): O SPSS vem com seu 
proprio modulo grafico bastante versatil. 
Entre os tipos de graficos disponiveis po- 
dem ser incluidos: diagramas de barras, 
histogramas, diagramas de dispersao, dia- 
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gramas de caixa-e-bigodes, diagramas de 
pizza e diagramas de barras de erros para 
enumerar apenas alguns. Existe tambem a 
facilidade para editar qualquer tipo de gra- 
fico para faze-lo parecer bastante atrativo, 
que, na minha opiniao, e bem formulado. 

• Window (Janela): Permite que se mude 
de uma janela para outra. Assim, se voce 
estiver olhando para uma saida e quiser re- 
tornar para a planilha, voce podera faze-lo 
utilizando esse menu. Existem fcones como 
atalhos para a maioria das opgoes desse 
menu assim ele nao e particularmente util. 

• Help (Ajuda): Esse e um menu inestima- 
vel pois ele oferece a voce ajuda on-line 
tanto sobre o proprio sistema quanto so- 
bre testes estatisticos. Embora os arquivos 
de auxilio estatfstico possam ser, as vezes, 
praticamente inuteis (afinal de contas o 
programa nao foi projetado para ensinar 
estatistica), eles certamente nao sao um 
substituto para a aquisigao de um bom 
conhecimento, mas podera livrar voce do 
aperto em algumas situagoes. 

Assim como os menus, existe ainda um 
conjunto de fcones no topo da janela do editor 
de dados (veja a Figura 2.2) que sao atalhos para 
recursos especificos que sao utilizados com fre- 
quencia. Todos esses recursos podem ser aces- 
sados pelo sistema de menus, mas utilizando os 
fcones voce poupara tempo. Abaixo uma lista 
breve desses fcones e para que servem: 




Esse icone fornece a opgao de abrir ar¬ 
quivos salvos previamente (se voce es¬ 
tiver no editor de dados o SPSS assume 
que voce quer abrir um arquivo de da¬ 
dos; se voce estiver no visualizador de 
saidas, ele assumira que voce quer abrir 
um arquivo desse tipo). 


HJ 


Esse icone permite que um arquivo seja 
salvo. Ele ira salvar o arquivo corrente, 
isto e, em que voce estiver trabalhando 
quando clicar no icone (seja ele de da¬ 
dos ou de saida). Se o arquivo ainda nao 
tiver sido previamente salvo ele abrira a 
caixa de dialogos save data as (salvar 
dados como). 


Aqui sera aberta a caixa de dialogos de 
impressao nao importa o tipo de arqui¬ 
vo que voce estiver trabalhando (dados 
ou saidas). As opgoes de impressao 
irao depender da impressora que voce 
estiver utilizando. Uma dica util e se- 
lecionar partes da saida clicando em 
porgoes da janela de saida (veja a Segao 
2.5). Quando a caixa de dialogos de im¬ 
pressao aparecer lembre-se de clicar na 
opgao de impressao apenas do texto se- 
lecionado. Selecionando partes do texto 
ira salvar muitas arvores pois a opgao 
do SPSS e imprimir tudo o que estiver 
na janela de saida. 



.kJ 


Clicando nesse icone ativara a lista das 
ultimas 12 caixas de dialogo que foram 
utilizadas. A partir dessa lista voce pode¬ 
ra selecionar qualquer caixa da lista que 
ela aparecera na tela. Esse icone facilita 
a repetigao de partes de uma analise. 
Esse icone permite que se va direto a um 
caso (isto e, um participante). Ele sera 
util se estivermos trabalhando com gran- 
des arquivos de dados. Por exemplo, se 
voce quiser analisar um levantamento 
com 3000 respondentes sera bastante 
tedioso ir rolando a tela ate encontrar 
a resposta de um participante em par¬ 
ticular. Esse icone pode ser utilizado 
para pular diretamente para o caso (por 
exemplo, caso 2407). Clicando nesse 
icone ativara uma caixa de dialogos que 
ira requerer que seja digitado o numero 
do caso procurado. 


o I Clicar nesse icone fomecera informagoes 
sobre uma determinada variavel do edi¬ 
tor de dados (uma caixa de dialogos per¬ 
mite a escolha de qual variavel se podera 
solicitar um resumo das informagoes). 



Esse icone nao e para permitir que voce 
faga observagao de passaros, mas ele 
permite que se procure por palavras ou 
numeros no arquivo de dados ou na ja¬ 
nela de saida. 



Ao clicar nesse icone um novo caso sera 
inserido no editor de dados (assim, ele 



cria uma linha em branco no ponto em 
que ele estiver destacado - cursor estiver 
posicionado). Essa fungao e muito util 
se for necessario adicionar novos dados 
ou se voce esqueceu-se de colocar os da¬ 
dos de um participante em particular no 
editor de dados. 

Clicar aqui ira criar uma nova variavel 
a esquerda da variavel que esta ativa no 
momenta (para ativar uma variavel, sim- 
plesmente clique uma vez no nome dela 
no topo da coluna). 

Esse fcone e um atalho para o comando 
Data=>Split File... (Dados=>Dividir 
Arquivo) (veja a Segao 3.4). Cientistas 
sociais as vezes conduzem experimentos 
com diferentes grupos de pessoas. No 
SPSS diferenciamos grupos de pessoas 
pela utilizacao de variaveis de codigo 
(veja a Segao 2.4.4) e essa fungao per- 
mite que se divida nossa safda de acordo 
com essa variavel. Por exemplo, pode- 
mos querer testar a habilidade estatfstica 
de homens e mulheres. Podemos codi- 
ficar cada participante com um mimero 
que representa o genero (por exemplo, 1 
= mulher, 0 = homem). Se quisermos 
entao saber a habilidade estatfstica me¬ 
dia de cada sexo nos simplesmente di- 
vidimos o arquivo utilizando a variavel 
genero. Qualquer analise subseqiiente 
sera executada para homens e mulheres 
separadamente. 

Esse fcone e um atalho para a fungao 
Data=>Weight Cases... (Dados=>Pon- 
derar Casos). Essa fungao e necessaria 
para quando trabalharmos com dados 
na forma de frequences (veja a Segao 
16.4.2) e e util para algumas situagSes 
avangadas de amostragem. 

Esse fcone e um atalho para a fungao 
I)ata=>Select Cases... (Dados=>Selc- 
cionar Casos). Se voce quer analisar 
apenas uma parte dos dados, essa e a op- 
gao a ser utilizada. Essa fungao permite 
que se especifique que casos devem ser 
inclufdos na analise. 


Ao clicar nesse fcone os rotulos dos 
dados para qualquer variavel que tenha 
esse tipo de caracterfstica aparecerao ou 
serao ocultados. Algumas vezes agru- 
pamos casos e para isso utilizamos uma 
variavel de grupo ou codificadora para 
informar o computar a que grupo cada 
caso pertence. Por exemplo, se codifica- 
mos o genero como 1 = mulher e 0 = 
homem entao o computador sabera que 
cada vez que o valor 1 aparecer na co¬ 
luna (variavel) genero a pessoa e uma 
mulher. Se voce pressionar esse fcone, a 
legenda (mulher) ira aparecer no editor 
de dados ao inves do valor numerico (1); 
assim, voce ira ver as palavras homem 
e mulher na coluna genero ao inves de 
uma serie de numeros (0 ou 1). A ideia 
se tornara mais clara na Segao 2.4.4. 

2.4.1 Entrando com os dados no 
editor © 

Quando voce executa o SPPS pela primeira 
vez ele vai apresentar uma planilha em branco 
no editor de dados e essa planilha sera nomeada 
de “sem tftulo” (isso e ridfculo pois uma vez que 
ela foi nomeada de “sem tftulo” ela ja tera um 
tftulo!). Quando entrar com um novo conjunto 
de dados, voce deve entrar com os seus dados 
de uma forma logica. O editor do SPSS e orga- 
nizado de forma que cada linha representa os 
dados de um objeto (individuo) enquanto que 
cada coluna representa uma variavel. Nao exis- 
te uma separagao para variaveis dependentes e 
independentes: os dois tipos devem ser coloca- 
dos em colunas separadas. O ponto chave e que 
cada linha representa os dados de uma pessoa. 
Portanto, qualquer informagao sobre cada caso 
deve ser fornecido com o editor de dados. Por 
exemplo, imagine que estamos interessados em 
investigar as diferengas entre os sexos quanto a 
percepgao de dor criada por estfmulos de quente 
e frio. Voce pode colocar as maos de algumas 
pessoas em um recipiente com agua gelada por 
um minuto e perguntar a elas para atribuirem 
um valor do quanto doloroso isso foi em uma 
escala de 0 a 10. Voce entao pode pedir a elas 
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para segurar uma batata quente e novamente 
medir as percepgbes de dor. Imagine que eu sou 
um participante. Voce tera uma unica linha re- 
presentando os meus dados, assim existira uma 
coluna diferente para o meu nome, minha ida- 
de, meu genera, minha percepgao de dor com 
a agua gelada e minha percepgao de dor com a 
batata quente: Andy, 31 (quando esse livro apa- 
receu), homem, 7, 10. 

A coluna com a informagao sobre o meu 
genera e uma variavel de grupo: posso perten- 
cer ou ao grupo dos homens ao das mulheres, 
mas nao a ambos. Como tal, essa variavel e 
uma variavel entre grupos (pessoas diferentes 
pertencem a grupos diferentes). Em vez de 
representar pessoas com palavras, no SPSS 
utilizamos numeros. Isso envolve atribuir a 
cada grupo um numero e entao informar ao 
SPSS que numero representa cada grupo. No 
entanto, variaveis entre grupos sao representa- 
das por uma unica coluna na qual o grupo que 
a pessoa pertence e definido por um numero 
(veja a Segao 2.4.4). Por exemplo, podemos 
decidir que uma pessoa e homem e daremos 
a ela o numero 0, ou se ela for mulher sera 
atribufdo o numero 1. Nos teremos entao que 
informar ao SPSS que cada vez que ele en- 
contrar um numero 1 em uma dada coluna a 
pessoa e mulher e se o valor for 0 essa pes¬ 
soa e homem. Variaveis que especificam a que 
grupo entre varios uma pessoa pertence pode 
ser utilizada para dividir arquivos (assim, no 
exemplo da dor voce pode executar uma ana- 
lise com os homens e as mulheres separada- 
mente - veja a Segao 3.4). 


Finalmente, as duas medidas da dor sao 
medidas repetidas (todos os participantes fo- 
ram sujeitos aos estlmulos de quente e frio). 
Desta forma, os nfveis dessa variavel podem 
ser fornecidos em colunas separadas (uma para 
a dor ao estlmulo quente e outra para o frio). 

O editor de dados e formado de celulas, que 
sao apenas quadras em que os valores dos da¬ 
dos podem ser colocados. Quando uma de tais 
celulas esta ativa ela se torna mais clara com 
as margens em preto destacadas (veja a Figura 
2.2). Voce pode se movimentar pelo editor de 
dados, de uma celula para outra, utilizando as 
teclas de setas <— T -l -4 (encontradas a direita 
no teclado) ou clicando com o mouse na celu¬ 
la que deseja ativar. Para entrar com um valor 
no editor simplesmente mova-se para a celula 
que deseja colocar o valor, digite o valor, e en¬ 
tao pressione a tecla com a seta para o lado que 
deseja continuar indo. Assim, para entrar com 
uma linha de dados, mova-se para a esquerda na 
mesma linha, digite o valor e entao pressione -4 
(esse processo entra com o valor e entao movi- 
menta o cursor para a proxima celula a direita). 

2.4.2 Criando uma variavel © 

O primeiro passo para entrar com dados e 
criar alguma variavel utilizando o painel “Va¬ 
riaveis” do editor de dados e entao entrar com 
os dados no painel “Dados” do editor. Nos 
seguiremos por esses dois passos trabalhando 
com um exemplo. Imagine que estamos inte- 
ressados em verificar a diferenga entre profes- 
sores e alunos. Tomamos ao acaso uma amos- 
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Dica da Samanta Ferrinho 


A 



V. 


Para resumir, qualquer variavel medida sobre os mesmos participantes (uma me- 
dida repetida) deve ser representada por varias colunas (cada coluna represen- 
tando um nivel da variavel de medidas repetidas). Entretanto, qualquer variavel 
que define grupos diferentes de pessoas (como ocorre quando o delineamento 
entre grupos e utilizado e diferentes participantes sao atribuidos a diferentes 
mveis da variavel independente) e definida utilizando uma unica coluna. Essa 
ideia se tornara mais clara a medida que voce aprender como executar procedi- 
mentos especlficos. 
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tra de cinco professores e alunos de psicologia 
da universidade de Sussex e verificamos quan- 
tos amigos cada um tem, o consumo semanal 
de alcool (em alguma unidade), a renda anual 
e quao neuroticos eles sao (escores mais altos 
significa maior neurose). Esses dados estao na 
Tabela 2.1. 

2.4.3 0 visualizador de variaveis 
(I Variable View) © 

Antes de realmente entrarmos com os da¬ 
dos no editor nos precisamos criar as variaveis. 
Para criar as variaveis utilizamos o painel varia¬ 
veis do editor de dados. Para acessar esse painel 
clique na orelha Variable View no fundo do edi¬ 
tor de dados (< I >| \□«»««»/ v»ri.bitview/ ); a janela 
ira mudar e a orelha do visualizador ficara bran- 
co (Figura 2.3). 

Cada linha do editor de variaveis represen- 
ta uma variavel, e para particularizar uma va¬ 
riavel basta configurar a coluna adequada. Voce 
pode alterar varias caracteristicas tais como, a 
largura da coluna, o numero de casas decimals 
apos a vfrgula que sera mostrado e se os valo- 
res ficarao alinhados a direita, a esquerda ou 
no centro (mexa um pouco com esses valores 
e voce pegara o jeito). As caracteristicas mais 
importantes sao as seguintes: 

Name Voce pode colocar nessa coluna 
o nome para cada variavel. Esse 
nome ira aparecer no imcio da coluna quando 


voce estiver no painel de dados e serve para 
ajudar voce a identificar as variaveis no painel 
dos dados. Existem algumas regras gerais so- 
bre nomes de variaveis tais como o de eles so 
poderem ter oito caracteres ou menos, as letras 
so podem ser as minusculas e voce nao podera 
utilizar espagos em branco. Se for violada 
qualquer uma dessas regras o computador dira 
que o nome da variavel e invalido quando voce 
clicar em uma celula diferente, ou tentar se 
movimentar para fora da celula utilizando uma 
tecla de seta. 


Type 


Voce pode ter diferentes tipos 
de dados. O tipo mais comum e 
numeric (numerico) (esse e o padrao, isto e, 
atribufdo por omissao e apenas informa que 
essa e uma variavel que contem numeros). 
Outro tipo e a variavel string (texto), que e 
uma contragao do “colecao de letras”. Assim 
se voce quiser digitar o nome das pessoas, por 
exemplo, voce precisara alterar o tipo de va¬ 
riavel para string (texto) em vez de numeric 
(numeric a). 


Label O nome de uma variavel (veja 
acima) e restrito a oito caracte¬ 
res, assim o SPSS fornece uma maneira para 
que possamos identificar as variaveis de uma 
forma mais conveniente (esse rotulo podera ter 
maiusculas e mesmo espagos!). Isso pode nao 
parecer importante mas e provavelmente um 
dos melhores habitos que voce podera adquirir. 
Se voce tiver uma variavel chamada “numero 


Tabela 2.1 

Alguns dados para brincar 





Amigos 

Alcool 

Renda 

Neurose 

Professor 

5 

10 

20000 

10 

Professor 

2 

15 

40000 

17 

Professor 

0 

20 

35000 

14 

Professor 

4 

5 

22000 

13 

Professor 

1 

30 

50000 

21 

Aluno 

10 

25 

5000 

7 

Aluno 

12 

20 

100 

13 

Aluno 

15 

16 

3000 

9 

Aluno 

12 

17 

10000 

14 

Aluno 

17 

18 

10 

13 
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Figura 2.3 O painel "visualizador de variaveis" do editor de dados do SPSS. 


de vezes que eu quis me dar um tiro durante 
uma aula de estatistica do Andy Field”, voce 
podera denomina-la de “tiro”. Se voce nao adi- 
cionar um rotulo, o SPSS ira utilizar o nome da 
variavel (nesse caso tiro) em todas as saidas de 
uma analise. Isso esta bem e podera ser bom, 
mas acredite, algum tempo depois quando voce 
tentar rever os dados e as analises provavelmen- 
te ira pensar “que raios significa tiro?” ou “que 
diabos e essa variavel sftg45c?”. Assim, mante- 
nha o bom habito de rotular as suas variaveis! 

Values Essa coluna e para atribuir nu- 
meros para representar grupos 
de pessoas (veja a Segao 2.4.4). 

Missing Essa coluna e para atribuir 

valores a dados missing (que 
faltam ou nao foram obtidos) (veja a Segao 
2.4.6). 

Measure Aqui e onde se define o nivel 
na qual a variavel foi mensura- 
da ( Nominal, Ordinal ou Scale ) (Nominal, Or¬ 
dinal ou Numerica). 

Para entrar com os dados anteriores no 
editor do SPSS voce precisara criar varias va¬ 
riaveis. Se comegarmos com a variavel nume- 
ro de amigos, devemos seguir esses passos: 

1. Clicar com o mouse na primeira celula 
em branco da coluna denominada Name 
(Nome). 

2. Digite a palavra friends (amigos) 
lembre-se que so podemos utilizar nomes 
com oito ou menos caracteres assim nao 
sera possfvel digitar number of friends 
(numero de amigos). 


3. Saia da celula utilizando as teclas com as 
setas do teclado (ou voce pode apenas cli¬ 
car em uma celula diferente, mas com as 
setas e mais rapido). 

Voce acaba de criar sua primeira variavel! 
Voce deve ter notado que uma vez que digitou 
um nome o SPSS cria alguns valores padroni- 
zados (por omissao) para a variavel (tal como 
assumir que ela e numerica e colocar duas casas 
apos a virgula). Agora em virtude de que voce 
quer manter bons habitos, mova para a celula na 
coluna chamada Label (Rotulo) e digite ‘nume¬ 
ro de amigos’. Finalmente, podemos especificar 
o nivel em que a variavel foi mensurada (veja o 
Quadro 2.1) indo para a coluna rotulada Mea¬ 
sure (Medida) e selecionando uma das opgoes 
Nominal, Ordinal ou Scale (Nomi¬ 
nal, Ordinal ou Numerica) da lista 
suspensa (veja o Quadro 2.1) 

Uma vez que uma variavel foi 
criada, voce pode retornar para o painel dos 
dados clicando na orelha Data View (visuali¬ 
zador de dados) na parte de baixo do editor de 

dados ( <l»l\ On'ay'leoX Variable View / ). O COnteddO da 

janela ira mudar e voce podera notar que a pri¬ 
meira coluna apresenta agora o rotulo friends 
(amigos). Para entrar com os dados, clique na 
celula no topo da coluna denominada friends 
(amigos) e digite o primeiro valor, 5. Para re¬ 
gistrar esse valor na celula, voce precisa se 
movimentar para uma celula diferente e em 
virtude de estarmos inserindo dados em colu- 
nas, a maneira mais facil de fazer isso e pres- 
sionando a tecla 1. Essa agao movera voce 
uma posigao abaixo e o numero 5.00 devera 


$ Scale 

a 1 Ordinal 
^Nominal 
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Quadro 2.1 


Niveis de Medida © 

Existem varios niveis nas quais as variaveis podem ser medidas: nominal, ordinal, intervalar 

e de razao. O mais baixo e o nominal, onde os numeros apenas representam nomes. Por exem- 

plo, se perguntarmos as pessoas se ler este capitulo as deixa com tedio, as respostas serao sim 

ou nao. Assim, as pessoas serao classificadas em duas categorias: entediadas ou nao-entedia- 

das, obviamente aqui o valor do numero e irrelevante e ele meramente representara uma das 

duas categorias (se voce estiver utilizando uma variavel codificadora [proxima segao] entao os 

dados sao nominais). Uma variavel ordinal nosfornece mais informagoes do que uma nominal. 

Se utilizarmos uma escala ordinal para medir algo, podemos informar nao apenas que coisas 

ocorreram, mas tambem a ordem em que elas aconteceram. No entanto, esses dados nao nos 

informam o valor das diferengas entre as categorias. Por exemplo, se classificarmos tres pessoas 

de acordo com o quanto elas estao entediadas - muito entediada, tedio medio e pouco entedia- 

da. Esses rotulos nos informam sobre o nivel de tedio. Ao utilizar categoriais ordinals nos agora 

sabemos que a pessoa mais entediada apresenta mais tedio do que a pessoa menos entediada! 

Dados em intervalo sao escores medidos por uma escala em que todos os intervalos sao iguais. 

Por exemplo, em vez de perguntar as pessoas se elas estao entediadas, poderiamos medir o 

tedio com uma escala de 10 pontos (com 0 representando alguem muito interessado e 10 al¬ 

guem totalmente entediado). Para dados em intervalo um aumento no tedio representado por 
uma mudanga do grau 3 na escala para 4 tern o mesmo valor que um aumento do grau 9 para 

o 10, mas nao e verdade que um entediado de grau 9 apresenta um tedio 3 vezes maior do que 
um classificado com grau 3. Dados de razao apresentam essa propriedade mas aqui e possivel 
afirmar que alguem com um grau 8 de tedio esta duas vezes mais entediado do que alguem que 
foi classificado com grau 4 de tedio. Esses dois tipos de dados sao representados pela opgao 
Scale (numerical no SPSS. Deve parecer obvio que em algumas ciencias sociais, principalmente 

psicologia, e extremamente dificil estabelecer se um dado e, de fato, intervalar (nos podemos 

realmente dizer que uma alteragao na escala de tedio representa uma mudanga genuina na expe¬ 

rience de apresentar tedio?) - veja Field e Hole (2003). 


aparecer na celula acima. Entre com o proxi¬ 
mo numero, 2, e entao pressione 1 novamente 
para seguir adiante. 

2.4.4 Criando variaveis codificadas CD 

Nas segoes anteriores eu mencionei as 
variaveis de grupo (codificadoras) e esta se¬ 
gao e dedicada uma descrigao completa des- 
se tipo de variavel (e um tipo de variavel que 
sera muito usada). Uma variavel codificadora 
(tambem conhecida como variavel de grupo 
ou agrupadora) e uma variavel que consiste em 
uma serie de numeros representada em niveis 
de uma variavel tratamento ou que descreve 
diferentes grupos de pessoas. Em experimen- 
tos, variaveis de grupo sao utilizadas para re- 
presentar variaveis independentes que tenham 


sido mensuradas entre grupos (isto e, diferen¬ 
tes participantes foram atribufdos a grupos di¬ 
ferentes). Assim, se voce esta realizando um 
experimento com um grupo de participantes 
em uma condigao experimental e um grupo 
diferente de participantes em um grupo em um 
grupo-controle, voce podera atribuir ao grapo- 
experimental o codigo 1 e ao grupo controle 
o codigo 0, por exemplo. Quando voce entrar 
com os dados no editor, entao devera criar 
uma variavel (que podera chama-la de gru¬ 
po) e digitar 1 para todos os participantes do 
grupo-experimental e 0 para qualquer partici- 
pante do grupo-controle. Esses codigos infor¬ 
mam ao computador que todos os casos que 
foram atribufdos ao grupo 1 devem ser trata- 
dos como se pertencentes a um mesmo grupo 
e da mesma forma para os casos em que foram 
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C “ 'N 

Existe uma regra simples de como as variaveis devem ser colocadas no editor de dados 
do SPSS: niveis de variaveis entre grupos devem variar verticalmente (ocupar uma unica 
coluna), enquanto que variaveis dentre-assuntos (medidas repetidas) devem variar hori- 
zontalmente (mesma linha). Veremos como essa regra funciona no Capitulo 6. 

V___/ 


atribufdos o valor 0. Em situaqoes que nao se- 
jam experimentos, voce podera simplesmente 
utilizar os codigos para distinguir grupos de 
pessoas ocorrendo naturalmente (por exem- 
plo, voce pode atribuir aos alunos o codigo 1 e 
aos professores o codigo 0). 

Nos temos uma variavel de codigo em 
nossos dados: e aquela descrevendo se uma 
pessoa e um professor ou um aluno. Para criar 
essa variavel codificadora, seguimos os pas- 
sos que seriam dados para criar uma variavel 
normal, mas devemos tambem informar ao 
computador que codigos numericos foram 
atribufdos e para quais grupos. Assim, antes 
de mais nada, retorne ao painel de visualiza- 
qao das variaveis se voce ainda nao estiver 
nele e mova-se para a celula na segunda li¬ 
nha do editor na coluna rotulada como Name 
(Nome). Digite um nome (chame-a de gru- 
po). Eu ainda estou tentando fazer com que 
voce adquira bons habitos, assim mova-se ao 
longo da segunda linha para a coluna denomi- 
nada de Label (Rotulo) e forneca a variavel 
uma descri§ao pormenorizada tal como ‘A 
pessoa e professor ou aluno?’ Entao para de- 
finir os codigos dos grupos, mova-se ao longo 
da segunda linha para a coluna denominada 

de__Voce vera que na celula esta escri- 

to None (Nada) e que existe um botao (veja a 
Figura 2.4). Clique nesse botao para acessar 
a caixa de dialogos Value labels (Valores dos 
rotulos) (veja a Figura 2.4). 

A caixa de dialogos Value labels (valo¬ 
res dos rotulos) e utilizada para especificar 
o codigo dos grupos. Isso pode ser feito em 
passos simples. Primeiro clique com o mou¬ 
se no espaco em branco proximo de onde diz 
Value (Valor) (ou pressione Alt e u ao mes- 
mo tempo) e digite o codigo (por exemplo, 
1). Esses codigos podem ser completamente 


arbitrarios; por simples convenqao as pessoas 
normalmente utilizam os valores 0, 1, 2, 3, 
etc., mas na pratica voce pode colocar um va¬ 
lor de 495 se voce estiver se sentindo particu- 
larmente arbitrario. O segundo passo e clicar 
com o mouse no espago em branco abaixo, 
proximo de onde diz Value label (Valor do ro¬ 
tulo) (ou pressionar Alt e ao mesmo tempo e) 
e digite um rotulo apropriado para o grupo. 
Na figura 2.4, eu digitei 2 como meu codigo 
e atribuf um rotulo de Student (Estudante). O 
terceiro passo e adicionar esse codigo na lista 
clicando em **■ . Na Figura 2.4, eu ja defini 
o codigo 1 para o grupo dos professores; para 
acrescentar o codigo do grupo dos estudantes 
clique em **■ . Quando voce definir todos os 
valores dos codigos, clique em <* ; se voce 
clicou no e esqueceu de adicionar o ul¬ 
timo codigo da lista, o SPSS ira exibir uma 
mensagem avisando que quaisquer altcraqoes 
pendentes serao perdidas. Em linguagem sim¬ 
ples ele esta dizendo para voltar e clicar no 
♦** antes de continuar. Finalmente variaveis 
de codigo sempre representam categorias e 
assim os nfveis em que elas sao mensuradas e 
nominal (ou ordinal se as categoriais tiverem 
uma ordem), assim e necessario especificar o 
nfvel em que a variavel foi mensurada indo 
ate a coluna denominada Measure (Medida) 
e selecionando Nominal (ou Ordinal se os 
grupos tiverem uma ordem) de uma lista sus- 
pensa. 

Tendo definido os codigos, voce pode 
entao mudar para o painel editor de dados e 
digitar os valores numericos na coluna apro- 
priada (se uma pessoa for um professor, di¬ 
gite 1, se for um estudante digite 2). O que e 
realmente excitante e que voce pode solicitar 
que o computador apresente os codigos ou 
os valores que voce forneceu clicando em V. 
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Figura 2.4 Definindo variaveis de codigo e seus valores no SPSS. 


(veja a Figura 2.5). A Figura 2.5 mostra como 
os dados devem ser arranjados para uma va¬ 
riavel de grupo/codigo. Agora, lembre que 
cada linha do editor de dados representa um 
participante e assim, neste exemplo, esta cla- 
ro que os cinco primeiros sao professores en- 
quanto que os de 6 a 10 sao estudantes. Esse 
exemplo, tambem, demonstra por que varia¬ 
veis de grupo sao utilizadas para variaveis 
que tenham sido mensuradas entre assuntos: 
porque pela utilizagao do codigo e impossf- 
vel para um participante pertencer a mais do 
que um grupo. Essa situacao deve ocorrer no 
delineamento entre grupos (isto e, cada par¬ 
ticipante deve ser testado em apenas um dos 
grupos: o experimental ou o controle). Entre- 
tanto, no delineamento de medidas repetidas 
(entre conteudos) cada participante e testado 
em cada uma das condicoes e assim nos nao 
iremos utilizar esse tipo de variavel de grupo 
(pois cada participante deve tomar parte em 
cada uma das condicoes experimentais). 


2.4.5 Tipos de variaveis © 

Existem diferentes tipos de variaveis que 
podem ser usadas no SPSS. Na maioria dos 
casos voce ira utilizar variaveis numericas. 
Essas variaveis sao aquelas que contem nume- 
ros e incluem as do tipo codigo que acabaram 
de ser descritas. No entanto, uma das outras 
opcoes ao se criar uma variavel e especificar o 
seu tipo, o que e feito clicando na coluna deno- 
minada ym no painel variavel e entao cli¬ 
cando em J (exatamente como foi feito na es- 
pecificacao dos rotulos na Figura 2.4). Isso ira 
ativar a caixa de dialogos Variable type (tipo 
de variavel) como na Figura 2.6, que mostra os 
Default (valores por omissao). Por padrao, uma 
variavel e estabelecida como sendo numerica e 
armazena oito dlgitos, mas voce pode trocar 
esse valor digitando um novo em um espaco 
denominado de Width (tamanho) na caixa de 
dialogos. Sob circunstancias normais voce nao 
necessitara mais do que o SPSS retenha mais 
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Figura 2.5 Codificando valores no editor de dados com os rotulos dos valores ativados e desa- 
tivados. 



Figura 2.6 Definindo o tipo de variavel sendo 
utilizado. 


do que oito dfgitos a menos que voce esteja 
fazendo calculos que sejam particularmente 
precisos. Outro valor determinado por omissao 
ou padrao sao as duas casas apos a vfrgula (de 
fato voce ira notar que por padrao sempre que 
voce digitar qualquer numero inteiro na plani- 
lha o SPSS acrescentara uma vfrgula seguida 
de dois zeros, isso podera ser desconcertante 
de infcio!) E bastante facil mudar o numero de 
casas decimals para uma dada variavel substi- 
tuindo o 2 por um novo valor que dependera 
do grau de precisao que for necessario. 

O variable type (tipo da variavel) da caixa 
de dialogos tambem permite que se especifi- 
que outros tipos de variaveis, na maior parte 


serao utilizados valores numericos. Outro tipo 
de variavel e a texto (string). Uma variavel 
texto e simplesmente uma linha de caracte- 
res e pode representar comentarios sobre um 
determinada participante ou outra informacao 
que nao se deseja analisar como uma variavel 
de agrupamento (como o nome do participan¬ 
te). Se for selecionada a opgao variavel texto 
(string), o SPSS permitira que se especifique 
o tamanho da variavel texto (string), que por 
omissao e de oito caracteres, de forma que sera 
possfvel inserir frases longas se necessario. 

2.4.6 Valores que faltam (missing) © 

Apesar de lutarmos para coletar conjuntos 
de dados completos ocorre que, muitas vezes, 
nos temos dados que nao podem, por algum 
motivo, ser obtidos, dados que faltam ou sao 
desconhecidos. A omissao de dados pode 
ocorrer por varios motivos: em questionarios 
longos os participantes podem acidentalmente 
esquecer-se de responder a algumas questoes; 
em procedimentos experimentais falhas meca- 
nicas podem fazer que o dado nao seja regis- 
trado e em levantamento de assuntos delica- 
dos (por exemplo, comportamento sexual) os 
participantes podem exercer o seu direito de 
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nao responder as questoes. No entanto, so por- 
que nao temos informa 5 oes sobre alguns de- 
talhes dos participates isso nao significa que 
devemos ignorar os demais dados que temos 
(embora isso possa em algumas vezes criar 
dificuldades estatfsticas). Nesses casos preci- 
samos informar ao computador que o dado de 
algum participante em particular esta faltando. 
O princfpio por tras dos valores desconhecidos 
e totalmente similar aquele sobre variaveis de 
grupo ou codificadoras, isto e, aqui devemos 
escolher ou arbitral' um valor para representar 
o ponto de dados que esta faltando. Esse va¬ 
lor simplesmente diz ao computador que nao 
existe um valor registrado para o participante 
para uma determinada variavel. O computador 
entao ira ignorar a celula do editor de dados 
(ele nao utiliza o valor em uma analise). Voce 
deve ter cuidado na escolha desse valor e certi- 
ficar-se que ele nao ira coincidir com qualquer 
valor existente no conjunto de dados original. 
Por exemplo, se informarmos ao computador 
que o valor 9 indica um valor desconhecido ou 
omitido e varios participantes apresentaram 
genuinamente esse escore, entao o computa¬ 
dor ira tratar esses dados como nao-existentes, 
quando na realidade, eles existem. 

Para especificar um codigo para os valo¬ 
res desconhecidos basta clicar na coluna de- 
nominada de Mi « m n no painel das variaveis 
do editor e entao clicar em para ativar a 
caixa de dialogos Missing Values (valores que 
faltam) na Figura 2.7. Por omissao, o SPSS 
assume que nao existem valores desconhe¬ 
cidos mas se voce, de fato, tiver dados com 



Figura 2.7 Definindo valores que faltam (mis¬ 
sing). 


esse tipo de problema voce pode escolher 
defini-los de tres formas: a primeira e selecio- 
nar valores isolados (clicando no cfrculo pro¬ 
ximo onde diz Discrete missing values - valo¬ 
res desconhecidos islolados) que sao valores 
unicos que representam dados que faltam. A 
razao pela qual voce pode querer escolher ter 
varios numeros para representar valores que 
faltam e que voce podera atribuir diferentes 
significados para cada um dos valores. Por 
exemplo, voce podera ter o numero 8 repre- 
sentando a resposta ‘nao se aplica’, um codigo 
9 para representar uma resposta ‘eu nao sei’ e 
um codigo 99 dizendo que o participante nao 
respondeu a questao. Para o computador nao 
fara difercnca e ele ira ignorar todas as celulas 
que contem esses valores; entretanto, a utili- 
zacao de codigos diferentes pode ser uma for¬ 
ma util de relembrar porque um determinado 
valor esta faltando. Normalmente, um valor 
discreto e suficiente e em um experimento em 
que atitudes sao mensuradas em uma escala 
de 100 pontos (escores variando de 1 a 100) 
voce pode escolher o valor 666 para represen¬ 
tar valores que faltam porque (1) esse valor 
nao ira ocorrer nos dados que foram coletados 
(2) porque valores que faltam criam proble- 
mas estatfsticos e voce podera lembrar que os 
que nao responderam a questoes do questio- 
nario sao filhotes do capeta! Uma segunda op- 
^ao e selecionar um intervalo de valores para 
representar dados que faltam e isto e util em 
situates na qual pode ser necessario excluir 
dados que tern valores entre dois pontos. As- 
sim, podemos querer excluir todos os escores 
entre 5 e 10. A opgao final e ter um intervalo 
de valores e nao valores isolados. 

2.4.7 Mudando o formato da coluna ® 

A ultima op^ao disponfvel quando defini- 
mos uma variavel e ajustar o formato da coluna 
dentro do editor de dados. A opgao por omissao 
e ter uma coluna que tem oito caracteres de lar- 
gura com todos os valores alinhas a direita. Es¬ 
ses dois valores podem ser alterados. No painel 
variaveis voce pode aumentar ou diminuir o va¬ 
lor padrao de 8 clicando nas setas abaixo e aci- 
ma (2]). Para mudar o alinhamento da coluna 
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mova-se para a coluna denominada Al| 9" 
(alinhar) e clique na celula da variavel que voce 
quer alterar. Voce pode entao ativar da lista 
apresentada em um menu suspenso clicando Z 1 
e selecionando umas das op£oes: 

Left, Right ou Center (Esquerda, Di- 
reita ou Centro). E particularmente 
util ajustar o tamanho da coluna quan- 
do voce tiver uma variavel de grupo (codigo) 
com rotulos que excedem os oito caracteres. 

2.4.8 Teste rapido © 

Tendo criado as variaveis amigos e tipo 
com um pouco de ajuda tente entrar com as 
demais variaveis da Tabela 2.1. Os dados fi¬ 
nals e as variaveis devem parecer com as da 
Figura 2.8 (mais ou menos!). 



2.5 0 VISUALIZADOR DE SAIDAS 
(OUTPUT VIEWER ) © 

Junto a janela de edigao de dados existe 
uma segunda janela conhecida como viewer 
(visualizadora) ou visualizadora de safdas ou 
simplesmente de safdas. Antigamente, a jane¬ 
la de safda (como era denominada) mostrava 
somente resultados estatfsticos em uma fon- 
te sem graga e os graficos eram apresentados 
em uma janela separada. 7 A nova e melhorada 
janela de safda dos resultados apresenta grafi¬ 
cos, tabelas e resultados estatfsticos no mesmo 
lugar (com fontes bem melhores e tabelas bem 


7 Ela se tornou o output navigator (navegador de safda) 
nas versoes 7.0 e 7.5, mas mudou o nome para viewer 
(visualizadora) na versao 8. 




Figura 2.8 Visao final dos dados e variaveis para os valores da Tabela 2.1 












































78 Andy Field 


apresentadas). Minha previsao na ultima edi- 
gao desse livro foi a de que futuras versoes do 
SPSS iriam incluir facilidades para fazer cha 
na janela de safda, mas infelizmente isso nao 
se realizou (SPSS por favor tome nota!). 

A Figura 2.9 mostra a estrutura basica da 
janela de safdas (ou de apresentagao de resul- 
tados). No lado direito existe um grande es- 
pago na qual a safda e apresentada. O SPSS 
mostra tanto graficos quanto resultados de 
analises estatfsticas nessa parte da janela. E 
tambem possfvel editar os graficos e para fa¬ 
zer isso voce simplesmente deve dar um duplo 
clique naquele que deseja ver editado. No lado 
esquerdo da janela de safda existe um diagra- 
ma de arvore ilustrando a estrutura da safda. 


Esse diagrama e util para quando for reali- 
zada uma serie de analises porque ela fornece 
uma forma facil de acessar partes especfficas 
da safda. A estrutura de arvore e praticamen- 
te autoexplicativa no sentido de que cada vez 
que for realizado um procedimento (tal como 
construir um grafico ou rodar uma analise 
estatfstica), o SPSS lista esse procedimento 
como um cabecalho principal. 

Na Figura 2.9, construf um grafico e entao 
conduzi uma analise univariada da variancia 
(ANOVA) e assim esses dois nomes aparecem 
como cabegalhos principals. Para cada proce¬ 
dimento existe uma serie de subprocedimentos 
e eles sao listados como ramos de uma arvore 
debaixo do cabegalho principal. Por exemplo. 
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no procedimento ANOVA existem varias se- 
goes de safda tais como o teste de Levene (que 
testa a hipotese de variancias homogeneas) e 
os efeitos entre grupos (isto e, o teste F que ve- 
rifica se as medias diferem significativamen- 
te). Voce pode pular para qualquer um destes 
subcomponentes da analise clicando no ramo 
apropriado do diagrama de arvore. Assim, 
se voce quiser ir direto para os resultados da 
analise entre grupos voce deve mover o cursor 
para a porgao esquerda da janela e clicar onde 
diz Tests of Between-Subjects Effects (Testes 
dos resultados entre sujeitos). Essa acao ira 
ressaltar essa parte da safda na parte maior da 
janela de visualizagao. Voce tambem utilizar 
esse diagrama de arvore para selecionar partes 
da safda para imprimir. Por exemplo, se quiser 
imprimir um grafico apenas e nao toda a safda, 
pode-se clicar na palavra Graph (Grafico) na 
estrutura de arvore e o grafico se tornara des- 
tacado no painel de safda. Sera entao possfvel 
por meio do menu de impressao determinar 
que seja impresso somente a parte destacada 
da janela de safda. Nesse contexto vale a pena 
notar que se for clicado no cabecalho principal 
(tal como Univariate Analysis of Variance - 
Analise Univaridada de Variancia) o SPSS vai 
destacar nao somente o cabecalho principal 
mas tambem todos os subcomponentes. Isso 
e extremamente util quando se quer imprimir 
os resultados de um unico procedimento es- 
tatfstico. 

Existem varios fcones na janela visuali- 
zadora de safdas que ajudam a realizar coisas 
rapidamente sem a necessidade de se recorrer 
aos menus. Alguns desses fcones sao os mes- 
mos que aqueles descritos na janela de edigao 
de dados assim iremos nos concentrar somen¬ 
te naqueles que dizerm respeito unicamente a 
janela de safda. 



Como ocorreu com a janela de edigtfo 
de dados, este fcone ativa o menu de 
impressao. No entanto, quando esse fco¬ 
ne e pressionado na janela de safda ele 
ativa um menu para imprimir a safda. 
Quando o menu de impressao esta ativo 
ele apresentara uma opgao por Default 
(omissao) para imprimir toda a safda ou 


voce podera escolher uma opgao para 
imprimir a safda no momento visfvel na 
tela ou, ainda mais util, uma opgao para 
imprimir uma selegao (parte) da safda. 
Para escolher essa ultima opgao voce ja 
deve ter previamente selecionado a par¬ 
te da safda que quiser imprimir (veja o 
mencionado anteriormente). 


3 

M 


Esse fcone leva voce rapidamente de 
volta ao editor de dados. 

Esse fcone leva voce a ultima safda da 
janela visualizadora (assim ele leva voce 
ao ultimo procedimento realizado). 



Esse fcone pega a parte ativa atual da es¬ 
trutura de arvore e avanca para um ramo 
acima. Por exemplo na Figura 2.9 o Tests 
of Between-Subjects Effects (Testes dos 
resultados entre sujeitos) e um subcom- 
ponente sob o tftulo Univariate Analy¬ 
sis of Variance (Analise univariada de 
variancia). Se quisermos promover essa 
parte da safda a um nfvel mais alto (isto 
e, faze-la um tftulo principal) entao isso 
podera ser feito com a utilizacao desse 
fcone. 



Esse fcone e o oposto do acima no senti- 
do de que ele rebaixa parte da estrutura 
de arvore. Por exemplo, na Figura 2.9, se 
nao quisermos que a Univariate Analy¬ 
sis of Variance (Analise univariada de 
variancia) seja a unica secao. nos pode- 
mos rebaixa-la de modo que ela se torne 
parte do item anterior (o item Grafico). 
Esse botao e util para combinar partes 
da safda que se relacionam a questoes de 
pesquisa especfficas. 



Esse fcone recolhe parte da estrutura 
de arvore o que significa, simplesmen- 
te, que ele oculta os subcomponentes 
sob um tftulo particular. Por exemplo 
na Figura 2.9, se selecionarmos Uni¬ 
variate Analysis of Variance (Analise 
univariada de variancia) e pressionar- 
mos esse fcone, todos os subtftulos 
irao desaparecer. As segoes que desa- 
parecem da estrutura nao sao elimina- 
das da propria safda mas existe apenas 
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uma condensagao da estrutura de arvo- 
re. Isso podera ser util quando existir 
muitas safdas e o diagrama de arvore 
tornar-se muito complicado. 

^ I Esse fcone expande ou oculta segoes. 

—-I Por omissao todos os tftulos principals 
sao mostrados no diagrama de arvore 
em sua forma expandida. Se, no entan- 
to, voce optou por ocultar parte do dia¬ 
grama (utilizando o fcone acima) entao 
voce poode utilizar esse fcone para des- 
fazer a sua besteira. 



Esse fcone e o seguinte permitem que se 
mostre ou oculte partes da propria safda. 
Assim, pode-se selecionar parte da safda 
no diagrama de arvore e entao utilizar 
esse fcone para que a propria safda seja 
ocultada. Ela nao e apagada, apenas fi- 
cara fora de vista. Assim, esse fcone e 
semelhante ao que oculta a estrutura de 
arvores so que ele afeta a propria safda 
em vez estrutura de arvore. Ele e util 
para eliminar detalhes irrelevantes. 



Esse fcone desfaz o que foi feito pelo 
anterior, assim se voce ocultou par¬ 
te da safda e clicar esse fcone ele fara 
essa parte oculta reaparecer. Por Default 
(omissao) todas as partes da safda sao 
exibidas e assim esse fcone nao esta ati- 
vo: ele se tornara ativo somente quando 
voce tiver ocultado parte da safda. 


si I Embora esse fcone parent com um rolo 
de pintura ele infelizmente nao pinta a 
casa para voce. O que faz e inserir um 
novo tftulo ao diagrama de arvore. Por 
exemplo, se voce realizou varios testes 
estatfsticos relacionados a uma ou mais 
questoes de pesquisa voce podera inserir 
um tftulo principal e entao rebaixar os tf¬ 
tulos das analises relevantes de modo que 
todos fiquem sob esse novo tftulo. 



Considerando que voce tenha feito o co- 
locado acima, voce podera utilizar esse 
fcone para fornecer ao novo tftulo uma 
legenda. O que voce digitar ira aparecer 
na safda. Assim, voce podera querer ter 
um cabecalho como ‘Questao de Pesqui¬ 


sa numero 1” que informant que as ana- 
lise sob esse cabegalho se relacionam 
com a primeira questao de pesquisa. 

[i) I Esse ultimo fcone e utilizado para co- 
locar uma caixa de texto na janela de 
safda. Voce podera digitar qualquer 
coisa nessa caixa. No contexto dos 
dois fcones anteriores voce podera uti¬ 
lizar um quadro de texto para explicar 
sua primeira questao de pesquisa (por 
exemplo, “Minha primeira questao de 
pesquisa e saber se o tedio se instalou 
ou nao ao final do primeiro capftulo do 
meu livro. A analise seguinte testa a hi- 
potese de que os nfveis de tedio serao 
significativamente mais altos ao final 
do capftulo do que no infcio.”). 


2.6 A JANELA DESINTAXE 



Eu mencionei anterior- 
mente que algumas vezes seria 
util utilizar a sintaxe do SPSS. 
Ela e uma linguagem de co- 
mandos para executar analises 
estatfsticas e manipulacao de dados. Na maio- 
ria das vezes nos faremos as coisa que preci- 
samos utilizando as caixas de dialogos; entre- 
tanto, a sintaxe do SPSS podera ser util. Em 
algumas situagoes existirao coisas que so po- 
derao ser executadas com o recurso da sintaxe 
(admito que muitas dessas coisas sao bastante 
avangadas, mas existirao umas poucas situa- 
goes nesse livro em que mostrarei a voce al- 
guns truques legais utilizando a sintaxe). Uma 
segunda razao para utilizarmos a sintaxe e se 
analises semelhantes forem executadas mui¬ 
tas vezes. Nessas situagoes e frequentemente 
mais rapido fazer a analise e salvar a sintaxe a 
medida que se prossegue. Felizmente isso e 
facil de fazer porque muitas das caixas de dia¬ 
logos do SPSS apresentam um botao . 
Quando voce tiver especificado a analise utili¬ 
zando uma caixa de dialogos, se clicar nesse 
botao colora a sintaxe utilizada em uma janela 
de sintaxe. Para abrir a janela de sintaxe utilize 
os menus File=>New=>Sintax. .. e uma janela 
de sintaxe em branco ira aparecer como a da 
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Figura 2.10. Nessa janela voce podera digitar 
os comandos de sintaxe que desejar. As regras 
da sintaxe do SPSS podem ser bastante frus- 
trantes (por exemplo, cada linha deve terminar 
com um ponto e se ele for esquecido uma 
mensagem de erro ira aparecer) e estao alem 
dos objetivos deste livro. Entretanto, a medida 
que formos avancando, mostrarei algumas 
coisas que darao a voce um pouco do sabor de 
como a sintaxe podera ser utilizada. Muitos 
de voces nao precisarao dela, mas para aque- 
les que desejarem ou precisarem espero que 
essa pequena amostra seja suficiente para que 
tenham o interesse despertado e continuem a 
aprender mais. Uma vez que os comandos te¬ 
nham sido digitados eles precisam ser execu- 
tados pela utilizagao do menu Run. O coman- 
do Run=>All executara toda a sintaxe digitada 
na janela (clicando em _l! isso tambem ocor- 
rera), ou voce podera marcar uma selegao da 
sua sintaxe com o mouse e utilizar o 
Run=>Selection para processar a sintaxe se- 
lecionada. Voce podera rodar o comando cor- 
rente utilizando Run=>Current 
(ou pressionar Ctrl e R no tecla- 
do) ou finalmente executar toda 
a sintaxe a partir do cursor ate o 
final da janela de sintaxe utili¬ 
zando Run=>To End. 

2.7 SALVANDO ARQUIVOS ® 

Embora muitos de voces estejam fami- 
liarizados com a tarefa de salvar arquivos no 
Windows, ela e um conhecimento vital e assim 
descreverei brevemente o que e preciso fazer. 


Para salvar um arquivo simplesmente utilize 
o fcone .H] (ou use os menus FiIe=>Save ou 
File=>Save As...). Se o arquivo for novo, en- 
tao clicar nesse fcone ativara a caixa de dialo- 
gos Save Data As (Salvar Dados como) (veja 
a Figura 2.11). Se voce estiver no editor de 
dados quando selecionar Save As... (Salvar 
Como) o SPSS ira salvar o arquivo em que 
voce estiver trabalhando no momento, mas se 
estiver no painel de visualizagao de safdas ele 
ira salvar a safda existente no momento. 

Existem varias caracterfsticas na caixa de 
dialogos da Figura 2.11. Primeiro voce precisar 
determinar um local onde armazenar (salvar) 
o arquivo. Normalmente, existem dois tipos 
de locais onde se pode guardar dados: o dis¬ 
co rfgido e as mfdias moveis (disquete, CDs, 
DVDs, Pen-Drives, etc.) ou outras opcoes que 
nem imagino que voce possa ter no seu com- 
putador. A primeira coisa a fazer e selecionar 
ou uma mfdia movel ou o disco rfgido e dar 
um duplo clique em Uma vez que tenha 
escolhido o local principal a caixa de dialogos 
mostrara todas as pastas disponfvies naquela 
mfdia em particular (voce pode ainda nao ter 
pastas no disco ou mfdia e nesse caso podera 
criar uma clicando em db . Logo que tiver se- 
lecionado uma pasta na qual ira salvar o arqui¬ 
vo voce precisara dar-lhe um nome. Se voce 
clicar no espago proximo onde diz File name 
(Nome do Arquivo) um cursor ira aparecer e 
voce podera digitar um nome de ate dez letras. 
Por omissao o arquivo sera salvo no formato 
do SPSS, assim ele apresentara a extensao 
.sav, se ele for um documento do visualizador 
de safdas ou janela de safda o arquivo tera a ex- 





Figura 2.10 Uma nova janela de sintaxe (esquerda) e uma com alguma sintaxe (direita). 
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Figura 2.11 A caixa de dialogos Save Data As (Salvar Dados Como). 


tensao . spo e se ele for um arquivo de sintaxe 
a extensao sera .sps. Entretanto, voce podera 
salvar dados em outros formatos tais como os 
do Microsoft Excel e arquivos textos delimita- 
dos por tabulates. Para fazer isso clique em 
l\ onde diz Save as type (Salvar como tipo) e 
uma lista dos possfveis formatos sera apresen- 
tada. Clique no tipo que voce desejar. Uma vez 
que um arquivo tenha sido previamente salvo, 
ele podera ser salvo novamente (atualizado) 
clicando em Ml Esse fcone aparece tanto no 
editor de dados quanto no visualizador de saf- 
das e o arquivo a ser salvo dependera da janela 
que estiver ativa no momento. O arquivo sera 
salvo no local em que ja estiver armazenado. 

2.8 RECUPERANDO UM ARQUIVO (!) 

Ao longo do livro voce ira trabalhar 
com arquivos de dados que estao disponf- 
veis no site www.artmed.com.br. Dessa for¬ 
ma e importante que voce saiba como car- 
regar esses arquivos de dados no SPSS. *0 
procedimento e bastante simples. Para abrir 
um arquivo simplesmente utilize o fcone MJ 


* N de R. Na edigao original, os arquivos foram disponi- 
bilizados em um CD. Nesta edigao, os mesmos arqui¬ 
vos devem ser acessados no site www.artmed.com.br e 
salvos em seu computador (conteudo em ingles). 


(ou utilize o menu File=^>Open^>Data... 
[Arquivo=> Abri r=>Dados]) para ativar a cai¬ 
xa de dialogos como na Figura 2.12. Primeiro 
voce precisa encontrar o local onde o arquivo 
esta armazenado (salvo). Se voce esta carre- 
gando o arquivo a partir do CD entao acesse 
o diretorio do CD clicando em zl, onde diz 
Look in (Olhar em) e uma lista de localizagao 
de diretorios sera mostrada. Uma vez que o di¬ 
retorio do CD tenha sido acessado (clicando 
em '.) voce deve ver uma lista de arquivos e 
pastas que podem ser abertas. Como ocorreu 
com o salvamento de um arquivo, voce esta 
no editor de dados entao o SPSS ira mostrar 
apenas arquivos de dados do SPSS para serem 
abertos (se voce estiver na janela de visualiza- 
gao de safda entao somente arquivos de safda 
serao mostrados). Se voce utilizar os menus 
e utilizar o caminho File=$Open=>Data... 
(Arquivo=>Abrir=>Dados) entao arquivos 
de dados serao apresentados, mas se utilizar 
o caminho File=^Open^Oiitpnt... (Arqui- 
vo=>Abrir=>Safdas) entao arquivos de safdas 
serao exibidos e se u sar File =^Oj)en =>Sintax... 
( Arquivo=>Abrir=>Sintaxe) entao arquivos de 
sintaxe serao mostrados (voce deve ter capta- 
do a ideia geral). Voce pode abrir uma pasta 
dando um duplo clique sobre o seu fcone. 
Uma vez que voce tenha chegado ao arquivo 
desejado voce podera abrf-lo selecionando-o 
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Figura 2.12 Caixa de dialogos para abrir um arquivo. 


com o mouse ou entao clicando no a * ,,r ' . ou 
ainda clicando duas vezes no l'cone proximo 
ao arquivo que deseja abrir (por exemplo, cli¬ 
cando duas vezes em M). Os dados do arqui¬ 
vo aparecerao entao na janela apropriada. Se 
voce esta no editor de dados e quiser abrir um 
arquivo de salda, clique em Z. onde diz Files 
of type (Arquivos do tipo) e uma lista alterna- 
tiva de formatos de arquivos sera apresentada. 
Clique no tipo de arquivo apropriado (docu- 
mento de salda ( *.spo ), arquivo de sintaxe 
( *.sps ), arquivo do Excel ( *.xls ), arquivo texto 
( *.dat, *.txt) e um arquivo de desse tipo estara 
disponlvel para ser aberto. 

2.9 0 QUE DESCOBRIMOS SOBRE 
ESTATISTICA? ® 

Este capltulo forneceu uma introdugao 
basica ao ambiente do SPSS. Vimos que ele 
utiliza duas janelas principais: um editor de 
dados e um visualizador de saldas. O editor de 
dados tern dois paineis um de dados (onde en- 
tramos com os valores ou dados) e um de va¬ 
riaveis (onde sao definidas as variaveis e suas 
propriedades). O visualizador e uma janela na 
qual toda salda aparece, tais como tabelas, es- 
tatlsticas e graficos. Nos tambem criamos nos- 
so primeiro conjunto de dados definindo algu- 
mas variaveis e entrando com alguns dados. 
Ao fazer isso, descobrimos que podemos co- 


dificar grupos de pessoas utilizando numeros 
(variaveis codificadoras) e descobrimos que 
linhas no editor de dados representam pessoas 
(ou casos de dados) e colunas representam 
diferentes variaveis. Finalmente damos uma 
olhada na janela de sintaxe e aprendemos 
como abrir e salvar arquivos. 


2.10 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• Dados de razao 

• Dados intervalares 

• Dados nominais 

• Dados ordinais 

• Editor de dados 

• Editor de sintaxe 

• Variaveis numericas 

• Variaveis texto 

• Visualizador 

• Visualizador de dados 


2.11 TAREFA DO ALEX ESPERTO 


A tarefa do Alex Esperto 
para este capltulo e salvar os 
dados que foram digitados. 
Salve-os em algum lugar do 
disco rlgido do seu computa- 
dor (ou em uma mldia movel se preferir). De 
um tltulo significativo (crie, talvez, uma pasta 
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chamada “Meus arquivos de dados” em “Meus 
documentos” um diretorio do Windows se 
voce estiver utilizando um PC.© 

2.12 LEITURAS COMPLEMENTARES 

EINSPRUCH, E. L. An Introductory guide to SPSS 
for Windows. Thousand Oaks (CA): Sage, 1998. 


FOSTER, J. J. Data Analysis using SPSS for 
Windows: a beginner’s guide. London: Sage, 
2001 (2 a ed.). 

KINNEAR, P. R„ GRAU, C. D. SPSS for Windows 
made simple (Release 10). Hove: Psychology 
Press, 2000. 



3 

EXPLORANDO DADOS 


3.1 0 QUE VOCE VAI APRENDER NESTE 
CAPITULO? © 

Como o tftulo sugere, este capftulo en- 
sinara o primeiro passo da analise de dados: 
explora-los. Wright (2003), citando Rosen¬ 
thal, afirma que pesquisadores devem “ficar 
amigos dos seus dados”. Nao, isso nao signifi- 
ca que quern utiliza estatfstica deve ser amigo 
dos seus dados porque sao os unicos amigos 
que eles tern; em vez disso, Rosenthal quer 
dizer que os pesquisadores muitas vezes fa- 
zem analises apressadas. Wright faz a analo- 
gia com um bom vinho; voce deve saborear o 
aroma e os sabores delicados para realmente 
apreciar a experiencia. Isso talvez exagere a 
beleza da analise de dados; no entanto, apres- 
sar a analise e, suponho, parecido com engolir 
o vinho: o resultado e confuso e incoerente! 
Este capftulo apresenta algumas formas de 
exploracao de dados. Comecaremos verifican- 
do como podemos examinar os dados, checar 
algumas hipoteses basicas sobre eles e entao 
determinar algumas estatfsticas descritivas e 
tragar alguns graficos. 


3.2 DADOS PARAMETRICOS © 

3.2.1 Hipoteses "retirar" © 

Muitos dos procedimentos estatfsticos 
descritos neste livro sao testes parametricos 

baseados na distribuigao normal (descrita na 

Segao 1.5). Um teste parametrico requer que os 

dados sejam retirados de um grande catalogo de 

distribuiqoes descritas por estatfsticos e para as 
quais certas suposigoes devem ser verdadeiras. 

Se voce utiliza um teste parametrico quando 

seus dados nao sao parametricos, os resultados 

talvez nao sejam apropriados. Dessa forma, e 

importante que voce verifique as hipoteses an¬ 

tes de decidir qual teste estatfstico e apropriado. 
Ao longo deste livro voce conhecera minha ob- 
sessao com hipoteses e sua checagem. A maio- 
ria testes parametricos baseados na distribuigao 
normal deve preencher quatro hipoteses basicas 
para que seja preciso. Muitos estudantes acham 
que testar suposicbes e uma tarefa entediante e 
frequentemente ficam confusos sobre como sa¬ 
ber se uma hipotese e ou nao-verdadeira. Assim, 
este capftulo foi projetado para leva-lo passo a 
passo em uma turne pelo mundo das suposicbes 
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parametricas (oh, que ex- 
citante!). Ate o momento, 
voce pode achar que essas 
suposicoes nao sao muito 
atraentes, mas elas podem 
ter grandes vantagens: 
pelo menos voce pode 
impressionar seus profes- 
sores/orientadores listan- 
do todas as hipoteses dos 
testes que eles violaram ao longo da carreira. 
Entao voce pode esquecer, no campo da esta- 
tfstica, as teorias que eles levaram a vida de- 
senvolvendo - e eles nao poderao censura-lo. 1 
Bern, como sempre digo, se voce precisa enca- 
rar a agonia de trabalhar com estati'stica, deve 
faze-la de forma apropriada. As hipoteses dos 
testes parametricos sao: 


1 Quando eu estava fazendo meu doutorado, recebemos 
a tarefa do nosso professor de estati'stica de pegar al- 
gum artigo publicado e criticar os raetodos estatisticos 
utilizados. Escolhi um do meu orientador e resolvi 
criticar duramente todos os procedimentos de analise 
de dados (e eu fui bastante pedante). Imagine o meu 
horror quando vi meu orientador aproximando-se aos 
pulos pelo corredor com um largo sorriso e declarando 
que, sem que eu soubesse, ele foi o segundo avaliador 
do meu ensaio. Felizmente, ele teve senso de humor e 
eu tirei uma boa nota.© 


as mesmas para as diferentes popula 9 oes 
sendo consideradas. Em delineamentos 
nos quais varios grupos de participantes 
sao testados, essa hipotese significa que 
cada uma das amostras foi retirada de po- 
pulacoes com a mesma variancia. Em de¬ 
lineamentos correlacionais, essa hipotese 
significa que a variancia de uma variavel 
deve ser estavel em rela^ao a todos os nf- 
veis da outra variavel (veja a Seqao 3.6). 

3. Dados por intervalo: Os dados devem ser 
mensurados pelo menos ao rn'vel ordinal 
(veja o Quadro 2.1 no Capftulo 2). Isso 
significa que a distancia entre os pontos 
da sua escala deve ser igual em todas as 
partes ao longo da escala. Por exemplo, 
se voce tem uma escala de ansiedade de 
10 pontos, a diferenca de ansiedade repre- 
sentada por uma alteragao de 2 para 3 no 
escore deve ser a mesma representada por 
uma alteracao do escore de 9 para 10. 

4. Independencia: Essa hipotese considera 
que os dados de participantes diferentes 
sao independentes, o que significa que o 
comportamento de um participante nao 
influencia o comportamento de outro. Nos 
delineamentos de medidas repetidas (na 
qual os participantes sao mensurados em 
mais de uma condigao experimental), es- 
peramos que os escores na condicao expe¬ 
rimental sejam dependentes para um dado 
participante, mas que o comportamento 
entre diferentes participantes deve ser in- 
dependente. Como exemplo, imagine que 
duas pessoas, Paulo e Julia, estao partici- 
pando de um experimento onde eles devem 
indicar se lembram de ter visto determina- 
das fotos anteriormente no experimento. Se 
Paulo e Julia pudessem conversar sobre se 
viram ou nao certas fotos, entao suas res- 
postas nao seriam independentes. A res- 
posta de Julia a uma determinada questao 
dependera da resposta de Paulo e isso viola 
a hipotese de independencia. Se Paulo e Ju¬ 
lia nao pudessem conversar (se estivessem 
em salas diferentes), suas respostas seriam 
independentes (a menos que eles fossem 
telepatas!): a resposta de Paulo nao seria 
influenciada pela de Julia e vice-versa. 



1. Dados normalmente distribufdos: 

Assume-se que os dados foram obtidos 

de uma ou mais populates normais. 

O fundamento dos testes de hipoteses 

baseia-se em ter populacoes distribufdas 

normalmente. Assim, se essa hipotese nao 
e satisfeita, a logica que os sustenta sera 

falha (esses princfpios ja mencionados no 
Capftulo 1 e serao explicados novamen- 
te no Capftulo 6). Muitos pesquisadores 
verificam suas amostras (utilizando um 
histograma) e se a amostra parece aproxi- 
madamente normal, eles assumem que as 
populates tambem serao. Veremos, neste 
capftulo, que podemos ir um passo alem 
dessa abordagem e testar se a amostra di- 
fere significativamente de uma normal. 

2. Homogeneidade da variancia: Essa hipo¬ 
tese significa que as variancias devem ser 
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As hipoteses de dados intervalares e me- 
didas independentes sao, infelizmente, testa- 
das somente pelo senso comum. A hipotese 
da homogeneidade da variancia e testada de 
forma diferente por diferentes procedimentos 
e, assim, embora abordemos esta hipotese na 
Segao 3.6, tambem iremos discutir esses tes¬ 
tes sempre que for necessario. Isso nos dei- 
xa somente com a hipotese de normalidade 
para checar e em muitos aspectos essa e, de 
qualquer forma, a hipotese mais importante. 
A maneira mais simples de testar essa hipo¬ 
tese e olhar para a distribuigao da amostra. 
Se os dados da amostra forem normalmente 
distribm'dos, nossa tendencia e assumir que 
eles vieram de uma populagao normal. Da 
mesma forma, se a nossa amostra nao for 
normalmente distribulda, iremos assumir 
que ela veio de uma distribuigao nao-normal. 
Assim, para testar essa hipotese, podemos 
comegar plotando com que frequencia cada 
escore ocorre (a distribuigao de fre quencias) 
e ver se ela parece normal. Vamos ver como 
se faz isso. 

3.3 APRESENTANDO DADOS 
GRAFICAMENTE © 

Vamos dar uma olhada em como podemos 
utilizar uma distribuigao de frequences, ou- 
tros graficos e estatistica descritiva para fazer 
uma analise completa de nossos dados. Vamos 
usar um exemplo para ilustrar o que queremos 
fazer. Uma biologa esta preocupada com os 
efeitos potenciais dos festivals de musica so- 
bre a saude. Assim, em determinado ano ela 
foi ao Festival de Musica de Glastonbury (os 
nao-britanicos podem fingir que o festival e 
o Roskilde, Ozzfest, Lollapalooza, Rock in 
Rio ou outro qualquer!) e verificou a higiene 
de 810 fas durante os tres dias de duragao do 
festival. Em teoria, cada pessoa foi avaliada 
diariamente, mas em virtude da dificuldade de 
fazer isso, faltaram alguns dados nos dias dois 
e tres. A higiene foi mensurada com a utiliza- 
gao de uma tecnica padrao (nao se preocupe: 
nao foi lamber a axila da pessoa) que resul- 
tou em um escore variando de 0 (voce esta 


cheirando como um cadaver em decomposi- 
gao em cima de um gamba) a 5 (voce cheira a 
rosas em um dia de primavera). Hoje, eu sei, 
por amargas experiences, que a higiene nem 
sempre e o forte nesses lugares (o Festival de 
Reading parece ser particularmente ruim...) e, 
assim, essa pesquisadora previu que a higiene 
pessoal diminuiria muito durante os tres dias 
do festival. O arquivo de dados denominado 
GlastonburyFestival.sav pode ser encontra- 
do no site www.artmed.com.br (veja a Segao 
2.8 para lembrar como abrir um arquivo) 

3.3.1 Passo 1: Apontando os erros 
obvios utilizando histogramas © 

A primeira coisa a fazer e construir o his- 
tograma para ver a forma dos dados. O SPSS 
tern recursos para construir diferentes tipos 
de graficos. Se voce clicar no menu Graphs 
(Graficos), uma lista aparecera aparecer mos- 
trando todas as opgoes dispomveis. Voce ja 
deve conhecer algumas delas (por exemplo, 
diagramas de pizza, barras, etc.): 

• Bar (Barras): Normal¬ 
mente utilizado para re- 
presentar medias de gru- 
pos diferentes de pessoas 
(Summaries for groups of 
cases - resumos para gru- 
pos de casos) ou media de 
variaveis diferentes (Sum¬ 
maries of separate varia¬ 
bles - resumos de diferen¬ 
tes variaveis). 

• Line (Linha): Tambem 
utilizado para representar 
medias. 

• Pie (Torta): Utilizado para apresentar fre¬ 
quencias e percentages. 

• Boxplot (Caixa e Bigode): Utilizado para 
mostrar a mediana, espalhamento e inter- 
valo interquartflico dos escores. 

• Error Bar (Barra de Erros): Mostra a me¬ 
dia e o intervalo de 95% de confianga em 
torno dessa media (veja o Capltulo 7). 

• Scatter (Dispersao): Mostra relagoes en- 
tre duas variaveis (veja o Capltulo 5). 
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• Histogram (Histograma): Mostra a frequen¬ 
ce de diferentes escores (litil para visualizar 
melhor a distribuigao dos escores) 

Voce ira notar que existe tambem uma op- 
cao denominada Interactive (Interativa), que 
abre outra lista com praticamente os mesmos 
graficos desse menu. Os graficos interativos 
sao na verdade esteticamente mais agradaveis 

e supostamente devem mudar quando os da¬ 

dos forem alterados (por isso o nome!). Assim, 
para fazer um histograma voce deve selecionar 
Graphs=>Interactive=>Histogram. .. (Grafi- 
cos=>Interativo=>Histograma) a fim de abrir 
uma caixa de dialogo como a da Figura 3.1. 

Note que as variaveis do editor de dados 
estao listadas no painel da esquerda e voce 
pode arrastar cada uma delas para qualquer 
um dos espacos em branco. Os dois eixos sao 
representados por setas e voce simplesmente 
arrasta a variavel para o espago adequado. No 
eixo vertical j a existe uma variavel denomina¬ 
da Count (Contagem). Isso, porque queremos 
contar a frequencia de cada escore e o SPSS 
fara isso. Para comegar, vamos fazer o histo¬ 
grama dos dados da higiene para o primeiro 
dia do festival. Selecione essa variavel da lista 
e arraste para o espaco do eixo horizontal. A 
caixa de dialogo final deve ser parecida com 
a da Figura 3.1. Voce notara um espaco deno- 


minado Panel variables (Painel de variaveis) 
e, se voce arrastar a variavel para o espaco, o 
SPSS ira criar um histograma para cada nfvel 
dessa variavel. Assim, se voce tiver uma varia¬ 
vel de grupo (codificadora) para genero e voce 
a colocar no espaco, obtera dois histogramas: 
um para as mulheres e outro para os homens. 
As opcdes padrao (por omissao) sao adequa- 
das e, dessa forma, voce pode apenas clicar 
no (se quiser ajustar uma curva normal ao 
histograma resultante, devera selecionar na 
guia Histogram (Histograma) a opgao Normal 
curve (Curva normal)). 

O histograma resultante e mostrado na Fi¬ 
gura 3.2 e voce logo notara que existe um caso 
que e bem diferente dos demais. Todos os esco¬ 
res parecem estar concentrados em um lado da 
distribuigao porque eles sao menores do que 5 
(formando uma distribuigao leptocurtica) com 
excegao de um, que apresentou um valor de 
20. Ele e um valor atfpico ( outlier ): um valor 
bem diferente dos demais. Valores atfpicos dis- 
torcem a media e inflacionam o desvio padrao 
(veja Field e Hole, 2003) e uma analise crite- 
riosa dos dados e uma forma de detecta-los. O 
estranho desse valor e que ele esta acima do 
valor maximo da escala utilizada (lembre-se: 
a escala de higiene varia de 0 a 5) e ele deve 
ser um erro (ou a pessoa tem um transtorno 
obsessivo-compulsivo e se esfregou tanto que 
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Figura 3.1 Caixa de dialogo para um histograma interativo (mudar as guias no topo da caixa de 
dialogo altera o conteudo da mesma). 
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Higiene (Primeiro dia do Festival de Glastonbury) 

Figura 3.2 Histograma dos escores da higiene (dia 1) do Festival de Glastonbury. 


atingiu um estado de limpeza extrema). Entre- 
tanto, com 810 casos, como iremos encontrar 
qual caso foi digitado errado? Podemos vas- 
culhar os dados, mas certamente teremos uma 
dor de cabega; em vez disso, podemos tracar 
um diagrama de caixa e bigodes. 

Falarei mais sobre diagramas de caixa e 
bigodes posteriormente neste capftulo, assim, 
por ora, apenas acredite em mim e selecione 
Graphs=>Boxplot (Graficos=>Diagrama de 
Caixa e Bigodes) para acessar a caixa de dia- 
logo. Dentro da janela, selecione Summaries 
of separate variables (Diagrama para varia- 
veis separadas) e clique em ■»*" (Definir). 
Isso abrira outra caixa de dialogo denominada 
Boxes Represent (Os quadros representam). 
Selecione as tres variaveis (representando os 
tres dias do festival) da lista e transfira todas 
para o painel denominado Boxes Represent 
(Os quadros representam) clicando em ID. 
Agora, clique em Qp *°"* (Opgbes) e, na caixa 


que abrir, selecione Exclude cases variable by 
variable (Exclua casos variavel por variavel). 
Precisamos selecionar essa opgao porque em 
algumas das nossas variaveis faltam valores e, 
se excluirmos os casos por listagem (Exclu¬ 
de cases listwise), entao se um caso tem um 
unico valor omitido em qualquer uma das tres 
variaveis, ele nao sera utilizado. Obviamente, 
nao queremos isso; queremos excluir somente 
os casos para a variavel na qual aquele valor 
esteja faltando. Para tanto, basta selecionar 
a opgao Exclude cases variable by variable 
(excluir casos variavel por variavel). A caixa 
de dialogo final sera semelhante a Figura 3.3. 
Clique em I“L para obter os graficos. 

O diagrama de caixa e bigodes resultante e 
apresentado na Figura 3.4. E importante notar 
que o que foi detectado no histograma e mos- 
trado acima do diagrama como um asterisco 
com um numero ao lado. Esse numero e a posi- 
gao do caso que produziu o valor atfpico. Ele e 
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Figura 3.3 Caixa de dialogo para definir um diagrama de caixa e bigodes para diversas variaveis. 



Higiene (Primeiro Higiene (Segundo Higiene (Terceiro 
dia do Festival) dia do Festival) dia do Festival) 


Figura 3.4 Diagrama de caixa e bigodes dos escores da higiene nos tres dias do Festival de 
Glastonbury. 


o caso de numero 611. Se voce for para o editor 
de dados podera localizar esse caso rapidamen- 
te clicando em M e digitando 611 na caixa de 
dialogo que aparece. Isso levara voce direto 


para o caso 611. Olhando para esse caso, voce 
verifica que o valor e 20,02, provavelmente um 
erro de digitacao de 2,02. Voce podera consul- 
tar as anotagoes (questionarios ou outro instru- 
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mento de coleta) para verificar. Vamos assumir 
que voce fez isso e que o valor e de fato 2,02, 
assim, substitua o valor 20,02 por 2,02 antes de 
continuar com esse exemplo. 

Agora que corrigimos o erro, vamos refa- 
zer o histograma. Enquanto fazemos isso de- 
vemos obter os histogramas para os dados dos 
dias dois e tres do festival tambem. A Figura 
3.5 mostra os tres histogramas resultantes. A 
primeira coisa a notar e que os dados do pri- 
meiro dia parecem mais saudaveis agora que 
removemos o que foi digitado errado. De fato, 
a distribuicao tern uma aparencia surpreenden- 
temente normal: ela e simetrica e nao parece 


nem pontiaguda nem achatada - isso e bom! 
No entanto, o mesmo nao acontece com as dis¬ 
tributes dos dias dois e tres, que nao parecem 
simetricas. Ambas sao positivamente assimetri- 
cas. Em geral, parece que os dados dos dias dois 
e tres estao mais concentrados em torno dos va- 
lores mais baixos da escala. Lembre que quanto 
mais baixo o escore, menos higienica a pessoa 
e, dessa forma, isso sugere que as pessoas estao 
mais sujas a medida que o festival progride. A 
assimetria acontece porque uma minoria insiste 
em manter seus nfveis de higiene (contra todas 
as chances!) ao longo do festival (lengos ume- 
decidos sao indispensaveis, eu acho). No entan- 





Figura 3.5 Histograma dos escores dos tres dias do festival de higiene de Glastonbury. 
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to, essas distribuigoes assimetricas podem nos 
causar problemas se quisermos utilizar testes 
parametricos. Na proxima segao, iremos verifi- 
car como medir a assimetria e a curtose (acha- 
tamento) dessas distribuigoes. 

3.3.2 Passo 2: Estatisticas descritivas e 
o diagrama de caixa e bigodes (D 

Tendo analisado rapidamente as distri- 
buigoes dos escores da higiene e detectado 
e corrigido um valor digitado incorretamen- 
te, devemos prosseguir procurando uma 
maneira de quantificar a forma das distri¬ 
buigoes e detectar valores atipicos. Para 
avangar na exploragao das distribuigoes das 
variaveis, podemos utilizar o comando fre¬ 
quencies (frequences), que e acessado uti- 
lizando o caminho Analyze=>Descriptive 
Statistics=>Frequencies... 2 (Analisar=>Esta- 


2 Lembre que esse caminho de menu sera Statis- 
tics=>Summarize=>Frequencies... (Estatistica=>Res 
umir=>Frequencias) na versao 8.0 e anteriores. 


tistica Descritiva=>Frequencias...). A caixa de 
dialogo principal e apresentada na Figura 3.6. 
As variaveis no editor de dados devem estar 
listadas no painel da esquerda e elas podem 
ser transferidas para o quadro denominado 
Variable(s) (Variavelfis]) clicando na varia- 
vel (ou destacando diversas com o mouse) e 
depois clicando em ID. Qualquer analise es- 
colhida sera realizada em todas as variaveis 
listadas no quadro Variable(s) (Variavel[is]). 
Se uma variavel listada no quadro Variable(s) 
(Variavel[is]) e selecionada com o mouse, ela 
pode se transferida de volta para a lista de va¬ 
riaveis clicando no botao com a seta (que deve 
agora estar apontando para a diregao oposta). 
Por padrao, o SPSS produz uma distribuigao 
de freqiiencias de todos os escores no formato 
de tabela. No entanto, existem duas outras cai- 
xas de dialogo que podem ser utilizadas para 
produzir outras opgoes. A caixa de dialogo 
Statistics (Estatisticas) e acessada clicando em 
s™*" e a caixa de dialogo charts (graficos) 
pode ser ativada clicando em 



Figura 3.6 Caixa de dialogo para o comando frequencies (frequencias). 
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A caixa de dialogo Statistics (Estatistica) 
permite a selecao de varias opcdes de manei- 
ras como a distribuicao dos escores pode ser 
descrita, como medidas de tendencia central 
(media, moda, mediana). medidas de variabi- 
lidade (amplitude, desvio padrao, variancia, 
quartis), medidas de forma (assimetria e cur- 
tose). Para descrever as caracteristicas dos da¬ 
dos, devemos selecionar a media, moda, me¬ 
diana, desvio padrao, variancia e amplitude. 
Para verificar se uma distribuicao e normal, 
precisamos olhar os valores da assimetria e 
da curtose. A opgao chart (diagramas) fornece 
uma maneira simples de representar grafica- 
mente a distribuicao dos escores (como um 
grafico de barras, um de pizza ou um histo- 
grama). Ja obtivemos histogramas dos nossos 
dados, assim, nao precisamos selecionar essa 
opcao, mas poderemos utiliza-la em analises 
futuras. Quando voce tiver selecionado as 
opcoes adequadas, retorne a caixa de dialogo 
principal clicando em . Uma vez la, cli¬ 
que em HL para obter a analise. 

A salda 3.1 do SPSS mostra a tabela das 
estatlsticas descritivas para as tres variaveis 
desse exemplo. Dessa tabela, podemos ve¬ 
rificar que, em media, os escores da higiene 
foram 1,77 (numa escala de 5) no primeiro dia 
do festival, mas cafram para 0,96 e 0,98 nos 
dias dois e tres, respectivamente. 

As outras medidas importantes para o nos- 
so objetivo sao a assimetria e a curtose; ambas 
apresentam um erro padrao associado. O valor 

da assimetria e da curtose deverao ser zero em 
uma distribuicao normal. Valores de assimetria 

positivos indicam uma concentracao de valores 
a esquerda enquanto um valor negativo mostra 

uma concentracao de valores a direita. Valores 
positivos da curtose indicam uma distribuicao 
pontiaguda e valores negativos indicam uma 

achatada. Quanto mais distante esses valores 

estiverem de zero, maior a possibilidade de 

que os dados nao sejam normais. Entretanto, 
os valores reais da assimetria e curtoses nao 
sao, eles proprios, informativos. Precisamos 
padronizar os valores, isto e, transforma-los 

em escores-z. Vimos na Secao 1.5.3 que um 
escore-z e simplesmente um valor da distribui¬ 


cao que apresenta media igual a 0 e desvio pa¬ 
drao igual a 1. O motivo para a conversao dos 
valores para escores-z e que dessa forma eles 
estarao padronizados. Assim, podemos con¬ 
verter qualquer variavel mensurada em qual- 
quer unidade em escores-z. Com essa trans- 
formacao, e possfvel comparar valores mesmo 
que tenham sido mensurados em unidades 
diferentes. Para transformar um valor em um 
escore-z, basta subtrair a media da distribuicao 
e dividir o resultado pelo desvio padrao da dis¬ 
tribuicao. Assimetria e curtose sao convertidas 
em escores-z da mesma forma. 


Z 


Assimetria 


S -0 
FP* 

Assimetria 


K 0 

Efcurtose 


Nas equacoes acima, os valores de S 
(Assimetria) e K (Curtose) e seus respecti- 
vos erros padroes sao fornecidos pelo SPSS. 
Esses escores-z podem ser comparados com 
os valores que esperarfamos serem obtidos 
apenas por acaso (isto e, valores conheci- 
dos para a distribuicao normal mostrados no 
Apendice). Assim, um valor absoluto maior 
do que 1,96 e significativo com p < 0,05, e 
um valor acima de 2,58 e significativo com p 
< 0,01. Valores absolutos acima de 3,29 sao 
significativos com p < 0,001. Amostras gran- 
des fornecerao erros padrao pequenos e, des¬ 
se modo, quando os tamanhos amostrais sao 
grandes, valores significativos serao obtidos 
mesmo com pequenos desvios da normali- 
dade. Em muitas amostras, valores acima de 
1,96 serao suficientes, no entanto, para amos¬ 
tras grandes esse criterio deve ser aumentado 
para 2,58 e com amostras muito grandes, em 
virtude do problema dos erros padrao peque¬ 
nos ja comentado, nenhum criterio deve ser 
utilizado! Se tivermos uma amostra grande 
(200 ou mais), e mais importante verificar vi- 
sualmente a forma da distribuicao e procurar 
os valores da assimetria e da curtose em vez 
de calcular suas significancias. 

Para os valores da higiene, o escore-z da 
assimetria e —0,004/0,086 = 0,047 no primei¬ 
ro dia, 1,095/0,150 = 7,300 no segundo dia 
e 1,033/0,218 = 4,739 no terceiro dia. Fica 
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V. 


• Para saber se a distribuigao dos escores e normal precisamos verificar os va- 

lores da assimetria e da curtose na salda do SPSS. 

• Valores positivos da curtose indicam uma distribuigao pontiaguda e negati¬ 

ves, uma achatada. 

• Quanto mais longe os valores estiverem de zero maior a probabilidade de que 

os dados nao sejam normalmente distribuidos. 




Saida 3.1 do SPSS 


Statistics (Estatisticas) 



Hygiene (Day 1 of 
Glastonbury Festival 
(Higiene do Primeiro 
dia do Festival de 
Glastonbury) 

Hygiene (Day 2 of 
Glastonbury Festival 
(Higiene do Segundo 
dia do Festival de 
Glastonbury) 

Hygiene (Day 1 of 
Glastonbury Festival 
(Higiene do Terceiro 
dia do Festival de 
Glastonbury) 

N Valid (Validos) 

810 

264 

123 

Missing (Desconhecidos) 

0 

546 

687 

Mean (Media) 

1.7711 

0.9609 

0.9765 

Std. Error of Mean (Erro Padrao da Media) 

0.02437 

0.04436 

0.06404 

Median (Mediana) 

1.7900 

0.7900 

0.7600 

Mode (Moda) 

2.00 

0.23 

0.44 

Standard Deviation (Desvio Padrao) 

0.69354 

0.72078 

0.71028 

Variance (Variancia) 

0.48100 

0.51952 

0.50449 

Skewness (Assimetria) 

0.004 

1.095 

1.033 

Std. Error of Skewness (Erro Padrao da 

0.086 

0.150 

0.218 

Assimetria) 




Kurtosis (Curtose) 

0.410 

0.822 

0.732 

Std. Error of Kurtosis (Erro Padrao da Cur- 

0.172 

0.299 

0.433 

tose) 




Range (Amplitude) 

3.67 

3.44 

3.39 

Minimum (Minimo) 

0.02 

0.00 

0.02 

Maximum (Maximo) 

3.69 

3.44 

3.41 


Existem multiplas modas. O menor valor e mostrado. 


claro entao, que embora no primeiro dia os 
escores sejam simetricos, nos dias 2 e 3 eles 
apresentam uma assimetria positiva significa- 
tiva mostrados pelos escores-z acima de 1,96 
(como ja tinha ftcado evidente pelos histogra- 
mas). No entanto, lembre o que foi dito sobre 
grandes amostras! Os escores-z da curtose 
sao: —0,410/0,172 = —2,38 no primeiro dia, 
0,822/0,299 = 2,75 no segundo e 0,732/0,433 
= 1,69 no terceiro dia. Esses valores indicam 
curtose significativa (ao nlvel de 5%) em todos 
os tres dias, mas em virtude da amostra grande 
isso nao e uma surpresa e podemos ficar ali- 


viados porque os tres valores estao abaixo do 
nosso valor limite de 3,29. 

A salda fornece a distribuigao de frequen- 
cias tabelada de cada variavel (nao reproduzi- 
das aqui). Essas tabelas listam cada escore e 
o numero de vezes que cada um aparece no 
conjunto de dados. Alem disso, cada valor da 
frequencia e expresso como um percentual do 
total da amostra. Tambem e fornecido o per¬ 
centual acumulado, que nos informa quantos 
casos (em percentual) estao abaixo de um de- 
terminado valor. Assim, por exemplo, podemos 
ver que somente 15,4% dos escores da higiene 
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estao abaixo de 1 no primeiro dia do festival. 
Compare isso com a tabela do segundo dia: 
63,3% dos escores foram menores do que 1! 

Tendo verificado a forma da distribuicao, 
precisamos procurar valores atfpicos ( outliers ) 
(veja o Quadro 3.1). Existem duas formas de 


fazer isso: (1) olhar o diagrama de caixa e bi- 
godes e (2) olhar os escores-z. Deixarei que o 
Alex Esperto lide com os escores-z no Qua¬ 
dro 3.2 e ficarei com os belos diagramas que 
sao mais adequados ao meu mvel de conheci- 
mento. Ja mostramos que o SPSS pode criar 


Quadro 3.1 


Valores atipicos © 

Um valor atipico ( outlier) e um escore bastante diferente do 

resto dos dados. Quando analisamos dados devemos estar cientes 
de tais valores porque eles podem introduzir tendenciosidades no 
modelo que ajustamos aos dados. Um bom exemplo dessa tenden- 
ciosidade pode ser vista em um modelo estatlstico simples como a 
media. Field e Hole (2003) apresentam um exemplo da avaliagao da 
primeira edigao deste livro na Amazon.co.uk. Esses valores podem 
variar de uma a cinco estrelas. Quando ele foi langado, sete pessoas 
fizeram uma avaliagao e deram uma nota para a primeira edigao com 
valores variando (na ordem em que foram obtidos) de 2, 5, 4, 5, 5, 
5, 5. Todas exceto uma dessas avaliagoes foram semelhantes (prin- 
cipalmente 4 e 5), mas o primeiro valor, de 2, foi bastante diferente 
dos restantes. No grafico sao mostrados os sete avaliadores no eixo 
horizontal e as notas atribuldas no eixo vertical. Nesse grafico existe 

uma linha horizontal que repre- 
senta a media dos sete valores 
(4,43 como verificado). Deve 
ficar claro que todos os esco¬ 
res, exceto um, ficam proximos 
dessa linha. 0 valor 2 e bastan¬ 
te diferente e esta situado bem 
abaixo da media. Esse escore 
e um exemplo de valor atipico 
[outlier). A linha horizontal pon- 
tilhada representa a media dos 
escores (4,83) quando o valor 
atipico nao e incluido. A linha 
e mais alta do que a original, 
indicando que se ignorarmos o 
escore atipico, a media aumenta 
(aumenta em 0,4). Isso mostra 
Avaliador como um unico valor pode vie- 

zar a media; nesse caso, o pri¬ 
meiro escore (de dois) pode baixar a media. Em termos praticos, isso tern uma implicagao grande 
porque a Amazon arredonda para meios valores, assim, esse unico valor faz diferenga entre o 
valor registrado pela empresa de 4,5 e o valor de 5 estrelas que seria obtido sem a consideragao 
do valor atipico (embora eu esteja ressentido com isso, agradego o otimo exemplo que eles estao 
me fornecendo um otimo exemplo de um valor atipico!) 

(Os dados desse exemplo foram obtidos no site http://www.amazon.co.uk/.) 


u) 4 


Media 

(sem valor atipico) 0 


Media 

(com valor atipico) Q 
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diagramas de caixa e bigodes na Figura 3.3; 
repita esse processo para os dados da higiene. 
O diagrama resultante agora deve parecer di- 
ferente (lembre que alteramos o valor incorre- 
to) e ele e mostrado na Figura 3.7. 

Os diagramas de caixa 
e bigodes na Figura 3.7 
nos informam sobre a 
distribuicao dos escores 
da higiene dos tres dias 
do Festival de Glaston¬ 
bury. O diagrama de cai¬ 
xa e bigodes nos mostra o 
menor escore (a linha ho¬ 
rizontal inferior em cada 
figura) e o maior (a linha 
superior horizontal de cada figura). A distan- 
cia entre a linha mais inferior e a aresta infe¬ 
rior da caixa e a amplitude onde os 25% esco¬ 
res mais baixos podem ser encontrados (e 
denominado quartil inferior). A caixa mostra 



os 50% dos escores situados no meio do con- 
junto de valores (denominado intervalo inter- 
quartilico): isto e, 50% dos escores sao maio- 
res do que a parte mais baixa da figura, mas 
menores do que a parte superior da figura. A 
distancia entre a aresta superior da caixa e a 
linha horizontal superior mostra o intervalo 
onde os 25% maiores escores poderao ser en¬ 
contrados (quartil superior). No meio da cai¬ 
xa ha uma linha horizontal levemente mais 
grossa que as arestas (bordas) da caixa. Essa 
linha representa a mediana, que seria o escore 
do meio se todos os escores da higiene fossem 
colocados em ordem. Assim, esses diagramas 
nos mostram o intervalo dos dados, o interva¬ 
lo onde estao situados os 50% dos valores do 
meio do conjunto e o escore mediano. Assim 
corno os histogramas, eles tambem nos infor¬ 
mam se a distribuicao e simetrica ou nao. No 
primeiro dia, em que a distribuicao e simetri¬ 
ca, os bigodes em cada lado apresentam o 



N = 810 


264 


123 


Dia 1 


Dia 2 


Dia 3 


Dias do Festival de Glastonbury 

Figura 3.7 Diagrama de caixa e bigodes dos escores de higiene de tres dias do Festival de Glas¬ 
tonbury. 
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Quadro 3.2 


Utilizando os escores-z para encontrar valores atipicos ® 

Para verificar a existencia de valores atipicos, podemos olhar os escores-z. 
Eles sao simplesmente uma maneira de padronizar os nossos dados. Com isso, 
quero dizer que os escores sao expressos em termos da media e do desvio pa¬ 
drao da distribuigao. Especificamente, expressamos os escores em termos de 
uma distribuigao que apresenta media igual a 0 e desvio padrao igual a 1 (veja a 
Segao 1.5). A vantagem de fazer isso e que e posslvel estabelecer pontos de 
referenda ( benchmarks ) que podemos aplicar a qualquer conjunto de dados (a despeito da me¬ 
dia e do desvio padrao que eles apresentem originalmente). E facil converter um dado em um 
escore-z: voce simplesmente pega um valor (X), subtrai a media de todos os escores (X) dele e 
divide o resultado pelo desvio padrao de todos os escores (s): 

x — x 

z = - 

s 

Em vez de fazer isso para cada escore 
manualmente, podemos solicitar que o 
SPSS faga isso por nos utilizando a caixa de 
dialogo Analyze=>Descriptive Statis¬ 
tics^ Descriptives... (Analisar=>Estatistica 
Descritiva=>Descritivas...), selecionando a 
variavel (como os dados da higiene do se- 
gundo dia conforme diagrama), ou diversas 
variaveis, e selecionando Save standardi¬ 
zed values as variables (Salvar valores pa- 
dronizados como variaveis) antes de clicar 
em * . 0 SPSS criara uma nova variavel no editor de dados (com o mesmo nome, mas antece- 
dido pela letra z). Podemos utilizar esses escores e contar quantos estao situados dentro de cer- 
tos limites previamente definidos. Se tomarmos o valor absoluto (isto e, ignorarmos se o 
escore-z e positivo ou negativo), em uma distribuigao normal esperariamos que aproximada- 
mente 5% tenham valores superiores a 1,96 (as vezes 2 e utilizado por convenience), 1% tenham 
valores maiores que 2,58 e praticamente nenhum esteja acima de 3,29. 

Alternativamente, e possivel utilizar alguma sintaxe do SPSS em uma janela de sintaxe para 
criar os escores-z e conta-los. No site www.artmed.com.br, ha um arquivo de sintaxe denomi- 
nado Outliers (Percentage of Z-escores).sps (Valores atlpicos[Percentagem de escores-z ]), que 
escrevi de modo a produzir uma tabela para os dados da higiene do segundo dia do Festival de 
Glastonbury. Carregue esse arquivo e execute a sintaxe, ou abra uma janela de sintaxe (veja a 
Segao 2.6) e digite o seguinte (lembre-se de colocar todos os pontos finais) - as explicagoes do 
codigo estao entre * (asteriscos) e nao precisam ser digitadas! 

DESCRIPTIVES 

VARIABLES=day2/SAVE. 

*Aqui e utilizada a fungao descritptives (descritivas) do SPSS na variavel day2 (em vez de 
utilizar a caixa de dialogo) para determinar e salvar os escores-z no editor de dados (eles serao 
apresentados como uma nova variavel denominada zday2).* 

COMPUTE outlierl = abs(zday2). 

EXECUTE 

(Continua) 


























98 Andy Field 


Quadro 3.2 ( Continuagao) 


*lsso cria uma nova variavel no editor de dados denominada outlier!, que content os valores 
absolutos dos escores-z recem-criados.* 

RECODE 

Outlierl (3.29 thru Highest = 4) (2.58 thru Highest = 3) (1.96 thru Highest = 2) (Lowest 
thru 2 = 1). 

EXECUTE. 

*lsso recodifica a variavel denominada outlierl de acordo com os pontos de referenda que 
descrevi. Assim, se um valor e maior do que 3,29, ele sera codificado como 4, se esta entre 2,58 
e 3,29, seu codigo sera 3, se estiver entre 1,96 e 2,58, o codigo e 2, e se for menor do 1,98, sera 
codificado como 1 .* 

VALUES LABEL outlierl 

1 'Absolute z-score less than 2' 2 'Absolute z-score greater than 1,96' 3 'Absolute z-score 
greater than 2.58' 4 'Absolute z-score greater than 3.29'. 

* Isso atribuira rotulos apropriados para os codigos definidos acima.* 

FREQUENCIES 

VARIABLES=outlier1 

/ORDER=ANALYSIS. 

*Finalmente, essa sintaxe utiliza o recurso frequencies (frequences) do SPSS para produzir uma 
tabela nos mostrando o percentual de uns, dois, tres e quatros encontrados na variavel outlierl .* 


Caso atipico 1 



Frequency 

(Frequences) 

Percent 

(Percentual) 

Valid Percent 
(Percentual 
de validos) 

Percent 

(Percentual) 

Valid Absolute z-score less than 2 (Valor absoluto 

246 

30.4 

93.2 

93.2 

(Valido) do escore-z menor do que 2) 





Absolute z-score greater than 1.96 (Valor 

12 

1.5 

4.5 

97.7 

absoluto do escore-z maior do que 1,96) 





Absolute z-score greater than 2.58 (Valor 

4 

0.5 

1.5 

99.2 

absoluto do escore-z maior do que 2,58) 





Absolute z-score greater than 3.29 (Valor 

2 

0.2 

0.8 

100.0 

absoluto do escore-z maior do que 3,29) 





Total 

264 

32.6 

100.0 


Missing System (Sistema desconhecido) 

546 

67.4 



Total 

810 

100.0 




A tabela produzida pela sintaxe e mostrada. Olhe para a coluna denominada "Valid Percent" 
(Percentual de validos). Esperariamos ver 95% dos casos com valores absolutos menores do que 
1,96, 5% (ou menos) com um valor absoluto maior do que 1,96 e 1% (ou menos) com um valor 
absoluto maior do que 2,58. Finalmente, nao esperariamos casos acima de 3,29 (bem, esses casos 
sao valores atipicos significativos). Para os escores de higiene do segundo dia do Festival de Glas¬ 
tonbury, 93,2% dos valores tern escores-z menores do que 1,96. Em outras palavras, 6,8% estao 
acima (olhando na tabela, obtemos esse valor pela soma de 4,5% + 1,5% + 0,8%). Esse resultado 
esta levemente acima dos 5% esperariamos fosse normal. Olhando para os valores acima de 2,58, 
esperariamos encontrar apenas 1 %, mas novamente temos aqui um valor maior, 
nesse caso, 2,3% (1,5% + 0,8%). Finalmente, descobrimos que 0,8% dos casos 
estao acima de 3,29 (assim, 0,8% sao valores atipicos significativos). Isso sugere 
que existem muitos valores atipicos nesse conjunto de dados e talvez tenhamos 
que fazer algo a respeito! 
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mesmo tamanho (o intervalo entre os 25% va- 
lores superiores e os 25% inferiores sao 
iguais). No entanto, nos dias dois e tres, os bi- 
godes situados no topo sao maiores do que os 
situados embaixo, mostrando que a distribui- 
(jao e assimetrica (isto e, 25% dos escores su¬ 
periores estao espalhados em um intervalo 
maior do que os 25% escores inferiores). Fi- 
nalmente, voce tera notado alguns circulos 
acima de cada um dos diagramas. Esses casos 
sao os valores atipicos (outliers). Cada circulo 
apresenta um niimero proximo a ele, infor- 
mando em que linha do editor de dados esse 
caso podera ser encontrado. Na proxima se- 
cao, veremos o que fazer a respeito desses va¬ 
lores atipicos. 

3.3.3 Passo 3: Corrigindo problemas nos 
dados © 

A ultima segao nos 
mostrou varias formas de 
explorar os nossos dados; 
vimos como olhar para os 
problemas com a nossa 
distribui^ao de escores e 
como detectar valores ati¬ 
picos. A proxima questao 
e o que fazer a respeito 
desses problemas. Se 
voce detectar valores ati¬ 
picos nos dados, existem varias formas de re- 
duzir o impacto desses valores. No entanto, 
antes que voce execute qualquer uma delas, 
vale a pena verificar se os dados foram digita- 
dos corretamente em cada um dos casos pro- 
blematicos. Se os dados estiverem corretos, as 
tres principals opgoes sao: 

1. Remover o caso: Isso ira obriga-lo a 
apagar os dados da pessoa que forneceu 
o valor atipico. Entretanto, isso so deve 
ser feito se voce tiver uma boa razao para 
acreditar que esse valor nao e um repre- 
sentante da populacao que voce pretende 
amostrar. Por exemplo, se voce esta in- 
vestigando fatores que afetam quanto os 
gatos ronronam e um gato nunca ronro- 
na, isso sera um valor atipico (todos os 


gatos ronronam). Apos a inspe£ao, se 
voce descobrir que esse gato era de fato 
um cachorro (o motivo dele nao ronro- 
nar) vestido de gato, teremos motivos 
para excluir esse caso, porque ele vem de 
uma populacao diferente (cachorros que 
gostam de se vestir como gatos) do que a 
populacao-alvo (gatos). 

2. Transformar os dados: Se voce tiver 
uma distribuicao nao-normal, isso devera 
ser feito de qualquer modo (distribuicoes 
assimetricas terao, por natureza, valores 
atipicos, pois sao eles os responsaveis 
pela falta de simetria!). Tais transforma- 
coes (ver a seguir) devem reduzir o im¬ 
pacto desses valores. 

3. Substituir o valor: Se a transforma£ao 
falhar, voce pode considerar a substitui- 
cao do valor. Colocado dessa forma, isso 
soa como uma falsificagao (voce esta alte- 
rando o valor daquilo que foi efetivamen- 
te obtido); no entanto, se o valor que voce 
esta alterando nao e representativo e ainda 
esta distorcendo o modelo, mudar o va¬ 
lor e o menor dos males! Existem varias 
op^'oes para substituir um valor: 

(a) O proximo escore mais alto adicio- 
nado de um: mude o dado para uma 
unidade maior do que o proximo va¬ 
lor mais alto do conjunto de dados. 

(b) Inverta o valor do escore-z: Um esco- 
re-z de 3,29 e um valor atipico (veja o 
Quadro 3.2), assim, podemos calcular 
qual escore forneceu o valor de 3,29 
(ou talvez 3) invertendo a equa^ao do 
Quadro 3.2 que ira fornecer: x = z x 
s + X. Tudo isso significa que calcula- 
mos a media (X) e o desvio padrao ( s ) 
dos dados, sabemos que z e 3 (precisa- 
mente 3,29) e, assim, apenas adiciona- 
mos o triplo do desvio padrao a media 
e substituimos o valor atipico por esse. 

(c) A media mais dois desvios padrao: 
Uma variagao do metodo acima e uti- 
lizar a media mais dois desvios padrao 
(em vez da media mais tres desvios 
padrao). 
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A proxima segao e de arrepiar os cabelos, 
portanto, nao se preocupe se ela nao fizer mui- 
to sentido. Muitos cursos de graduagao nao 
abordam a transformagao dos dados assim, 
sinta-se a vontade para ignorar esta segao se 
voce quiser! 

De todas as opgoes acima, transformar os 
dados e talvez a melhor, pois em vez de mu- 
dar um unico valor, uma alteragao e feita em 
todos eles (assim, voce nao esta apenas se- 
lecionando um escore para ser alterado, mas 
fazendo algo para reduzir o impacto dos va- 
lores extremos). Dessa forma, a ideia por tras 
da transformagao e mudar todos os dados para 
corrigir problemas relacionados ao modelo ou 
valores atipicos. Embora alguns estudantes 
muitas vezes (compreensivelmente) pensem 
que transformar os dados seja errado (a fra- 
se “falsificar os resultados” vem a mente de 
algumas pessoas!), de fato, nao e isso, pois 
voce faz a mesma coisa com todos os dados. 3 
Assim, a transformagao dos dados nao ira al- 
terar o relacionamento entre variaveis (as di- 
ferengas relativas entre pessoas para uma dada 
variavel permanecem as mesmas), mas ela 
altera as diferengas entre as variaveis (porque 
altera as unidades de medida). Dessa forma, 
mesmo se voce tiver apenas uma variavel que 
apresenta uma distribuigao assimetrica, ainda 
deve transformar qualquer outra variavel do 
seu conjunto de dados se ira comparar dife¬ 
rengas entre essa variavel e outras que preten- 
de transformar. Assim, por exemplo, com os 
dados da higiene, voce pode querer observar 
como os nrveis de higiene se alteraram ao lon- 
go dos tres dias (isto e, comparar a media do 
dia 1 com as medias dos dias 2 e 3). Os dados 
dos dias 2 e 3 sao assimetricos e precisam ser 
transformados, mas em virtude de podermos 
querer mais tarde comparar os dados aos do 


3 Embora nao existam conseqiiencias estatfsticas em 
transformar os dados, como Grayson (2004) aponta, 
podem existir implicates empi'ricas ou cientfficas que 
se sobreponham os beneficios estatfsticos. Especifica- 
mente, transformar significa que estamos agora traba- 
lhando em um construto diferente do que foi original- 
mente mensurado e isso acarreta implicates obvias na 
interpreta$ao desses dados. 


primeiro dia, devemos transformar tambem os 
dados do primeiro dia (mesmo que eles nao 
sejam assimetricos). Se nao transformarmos 
os dados do primeiro dia, qualquer diferenga 
nos escores da higiene que encontrarmos entre 
os dias 1, 2 e 3 sera por termos transformado 
uma variavel e nao as demais. 

Quando voce tiver dados com assimetria 
positiva (como ocorre aqui) que precisam ser 
corrigidos, existem tres transformagoes que 
podem ser uteis (como veremos, elas podem 
ser adaptadas para lidar com dados com assi¬ 
metria negativa tambem): 4 

1. Transformagao logaritmica (log(Z,)): 

Tomar o logaritmo de um conjunto de nu- 
meros esmaga a cauda direita da distribui¬ 
gao. Portanto, e uma boa maneira de re¬ 
duzir uma assimetria positiva. No entanto, 
voce nao pode obter o logaritmo de zero 
ou de valores negativos, assim, se os seus 
dados tendem para zero ou produzem nu- 
meros negativos, e necessario adicionar 
uma constante a todos os valores antes de 
realizar a transformagao. Por exemplo, se 
voce tiver zeros nos dados, faga log(X, + 
1), ou se tiver valores negativos, adicione 
qualquer valor que faga o menor dos valo¬ 
res do conjunto se tornar positivo. 

2. Transformagao por radiciagao (Vz,): 
Tomar a raiz quadrada de valores grandes 
tern um efeito maior do que extrair a raiz 
de pequenos valores. Consequentemente, 
tomar a raiz quadrada de cada um dos va¬ 
lores fara com que cada valor grande fique 
mais proximo do centra, parecido com a 
transformagao logaritmica. Isso podera ser 
util para reduzir dados com assimetria po¬ 
sitiva; no entanto, voce ainda tera o mes¬ 
mo problema com os numeros negativos 
(eles nao apresentam raizes quadradas). 


4 Voce notara, nesta segao, que continuo escrevendo X;. 
Vimos no Capftulo 1 que ele se refere ao escore da 
i-esima pessoa (assim, o i pode ser substitufdo pelo 
nome dessa pessoa em particular, por exemplo, Grego¬ 
rio, Xj = X Greg6ri0 = Escore do Gregorio, e para Carol, X, 
— X Carol — Escore da Carol). 
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3. Transformagao reriproca (1/Aj): Divi- 
dir 1 por cada escore reduz o impacto dos 
grandes valores. A variavel transformada 
tera um limite inferior de 0 (grandes valo¬ 
res ficarao proximos de zero). Uma coi- 
sa deve ser levada em consideragao para 
executar esse tipo de transformagao: ela 
reverte os escores, ou seja, valores que 
eram originalmente grandes no conjunto 
de dados se tornarao pequenos no conjun¬ 
to transformado (proximos a zero), mas 
escores que eram originalmente pequenos 
se tornarao grandes apos a transformagao. 
Por exemplo, imagine dois escores de 1 e 
10. Apos a transformagao, eles se tornarao 
1/1 = 1 e 1/10 = 0,1: o escore pequeno se 
torna maior do que o escore grande depois 
da transformagao. No entanto, voce pode 
evitar isso revertendo os escores antes da 
transformagao, encontrando o maior valor 
e mudando cada escore para o mais alto 
menos o escore que quer transformar. As- 
sim, a seguinte transformagao devera ser 
realizada: l/(X MSximo - X,). 

Cada uma dessas transformagoes tambem 
pode ser utilizada para corrigir dados com 
assimetria negativa, mas primeiro sera neces- 
sario reverter os valores (isto e, subtrair cada 
um dos valores do valor maximo observado). 
Se voce fizer isso, nao se esquega de reverter 
os valores novamente depois! 

3.3.4 Passo 4: Transformando dados 
utilizando o SPSS © 

O proximo assunto e como realizar essas 
transformagoes no SPSS, e isso nos leva ao co- 
mando compute (calcular). Esse comando per- 
mite executar varias fungoes nas colunas dos 
dados no editor. Algumas fungoes tfpicas sao 
adicionar valores de varias colunas, calcular a 
raiz quadrada dos valores de um determinada 
coluna, ou calcular a media de diversas varia- 
veis (colunas). Para obter a caixa de dialogo 
do comando, utilize o mouse para especificar 
Transform=>Compute. .. (Transformar=>Cal- 
cular...). A caixa de dialogo resultante e mos- 
trada na Figura 3.8. Nessa caixa de dialogo, 


existe uma lista de fungoes no painel do lado 
direito e um teclado semelhante a uma calcula- 
dora no centra. A maioria das fungoes da cal- 
culadora sao obvias e as mais comuns sao: 

♦ I Addition (Adigao): Esse botao coloca 
um sfmbolo de mais na area de coman- 
dos. Por exemplo, com nossos dados da 
higiene, “dayl + day2” cria uma coluna 
onde cada linha contem um escore da 
higiene da coluna denominada dayl so- 
mado ao escore da coluna denominada 
day2 (assim, para o primeiro participan- 
te: 2,65 + 1,35 = 4). 

| Subtraction (Subtragao): Esse botao 
coloca um sinal de menos na area de 
comandos. Por exemplo, se quisermos 
calcular a mudanga ocorrida na higiene 
do primeiro dia em relagao ao segundo 
dia, podemos digitar “day2 - dayl”. Isso 
criara criar uma coluna onde cada linha 
contem um valor da coluna denominada 
day2 subtrafdo do valor da coluna deno¬ 
minada dayl (assim, para o participante 
1: 2,65 - 1,35 = —1,30). Dessa forma, 
a higiene da pessoa caiu 1,30 (na nossa 
escala de cinco pontos) do primeiro dia 
para o segundo dia do festival. 

| Multiply (Multiplicar). Esse botao colo¬ 
ca um sinal de multiplicagao na area de 
comandos. Por exemplo, “dayl*day2” 
criar uma coluna que contera os escores 
da coluna denominada dayl multipli- 
cado pelo escore da coluna denomina¬ 
da day2 (assim, para o participante 1: 
2.65x1,35 = 3,58). 

A Divide (Dividir). Esse botao coloca um 
sinal de divisao na area de comandos. 
Por exemplo, “dayl/day2” criar uma 
coluna que contera os escores da coluna 
denominada dayl divididos pelos esco¬ 
res da coluna denominada day2 (assim, 
para o participante 1: 2,65/1,35 = 1,96). 
••[ Exponentiation (Exponenciagao). Esse 
botao e utilizado para elevar o termo 
a uma potencia especificada. Assim, 
“day 1**2” cria uma coluna que contera 
os escores da coluna denominada dayl 
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elevada a potencia 2 (assim, para o parti¬ 
cipate 1: 2,65 2 = 7,02). Da mesma for¬ 
ma “dayl**3” cria uma coluna com os 
valores da variavel day / ao cubo. 

<' Less than (Menor que). Essa operagao e 
normalmente utilizada pela fungao inclu¬ 
de case (incluir casos). Se voce clicar no 
botao ft-, uma caixa de dialogo aparece 
e permite que sejam selecionados certos 
casos nos quais e possfvel executar al- 
guma operagao. Assim, se for digitado 
“dayl < 1”, o SPSS executara a fungao 
compute (calcular) apenas para aqueles 
participantes cujo escore de higiene no 
primeiro dia do festival sejam menores 
do que 1 (isto e, se dayl for 0,99 ou me- 
nos). Dessa forma, podemos utiliza-la 
para ver quais pessoas ja estavam feden- 
do no primeiro dia do festival! 

<-l Less than or equal to (Menor que ou 
igual a). Essa operagao e a mesma que 
a anterior, mas os casos que sao exata- 
mente 1 tambem seriam incluidos. 

> | More than (Maior que). Essa operagao 
e normalmente utilizada para incluir ca¬ 
sos acima de um certo valor. Assim, se 
voce clicar no botao « e digitar “dayl 
> 1”, o SPSS fara uma analise apenas 
nos casos em que o escore da higiene no 
primeiro dia do festival for maior do que 
1 (isto e, 1,01 ou acima). Isso pode ser 
utilizado, caso voce queira, para excluir 
aquelas pessoas que ja estavam fedendo 
quando o festival comegou (como esta- 
mos interessados nos efeitos do festival 
na higiene das pessoas, esses casos iriam 
contaminar os dados - sem mencionar 
nossas narinas!) 

>.| More than or equal to (Maior que ou 
igual a). Essa operagao e a mesma que 
a anterior, mas ira incluir casos que sao 
exatamente iguais a 1. 

- | Equal to (Igual a). Voce pode utilizar 
essa operagao para incluir casos em que 
os participantes tenham um valor espe- 
cffico. Assim, “dayl = 1” digitado na 
caixa de dialogo //'(se) assegura que so- 


mente casos que tenham valores iguais a 
1 para a variavel dayl serao incluidos. 
Isso sera mais util quando tivermos uma 
variavel de grupo e quisermos trabalhar 
com apenas um dos grupos. Por exem- 
plo, se voce tiver a variavel musica para 
agrupar os generos musicais dos parti¬ 
cipantes do festival (veja a Segao 5.10) 
como 1 = Pagodeiros, 2 = Metaleiros, 
3 = Punks e 4 = Ecleticos, e digitar 
“musica = 2”, a analise sera executada 
somente com aquelas pessoas que se 
identificam como “metaleiras” (pessoas 
que ouvem heavy metal). 

~.| Not equal to (Nao igual a). Essa ope¬ 
ragao ira incluir todos os casos exceto 
aqueles com valores especfficos. Assim, 
“musica = 2” incluira todos os casos ex¬ 
ceto aqueles que se identificaram como 
metaleiros. 

Variable type (Tipo de variavel). 
Esse botao abre uma caixa de dialogo 
que permite fornecer um nome para 
uma nova variavel e especificar que 
tipo de variavel ela e (por exemplo, 
numeric a). 

O resultado de qualquer uma das fungoes 
de calculo ira produzir uma nova coluna no 
editor de dados, portanto, a primeira coisa a 
fazer e digitar um nome para essa nova varia¬ 
vel (na caixa denominada Target Variable [va¬ 
riavel alvo]). Se voce digitar um nome que ja 
existe, o SPSS ira informar e perguntar se quer 
altera-lo ou substituir a variavel existente. Se 
voce responder “Yes” (Sim), o SPSS substitui- 
ra os dados existentes na coluna com os resul- 
tados da fungao utilizada. Se voce responder 
“No” (Nao), nada acontecera e voce precisara 
renomear a nova variavel. Se voce clicar em 
outra caixa de dialogo aparecera, em 
que voce pode fornecer a nova variavel um 
rotulo descritivo e especificar se ela e nume- 
rica ou texto (veja a Segao 2.4.5). O quadro 
denominado Numeric Expression (Expressao 
Numerica) e o espago onde os comandos nu- 
mericos sao digitados (chamei esse espago de 
“area de comandos”). Voce podera entrar com 
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os nomes das variaveis na area de comandos 
selecionando a variavel requerida da lista de 
variaveis e clicando em _f_l. Da mesma forma, 
voce podera selecionar certas fungoes da lista 
de fungoes disponiveis e coloca-las na area de 
comandos clicando em . 

Algumas das fungoes mais uteis estao 
listadas na Tabela 3.1, que mostra a forma 
padrao de cada uma, o nome, um exemplo de 
como ela podera ser utilizada e o que o SPSS 
mostraria como saida se a fungao fosse utili¬ 
zada no exemplo dado. Existem varias fungoes 
basicas para calcular medias, desvios padrao e 
soma de colunas. Existem tambem fungoes, 
como a raiz quadrada e as logaritmicas, uteis 
para transformar dados que apresentam assi- 
metria; essas sao as fungoes que iremos uti- 
lizar agora. Para o leitor interessado, o guia 
basico do usuario do sistema SPSS (e os ar- 
quivos de ajuda do programa) apresentam de- 
talhes de todas as fungoes disponiveis na caixa 
de dialogo compute (calcular) (Norusis, 1997, 
veja tambem SPSS Inc., 1997) 


Agora que verificamos como utilizar 
as fungoes basicas do comando compute 
(calcular), vamos utiliza-lo para transfor¬ 
mar os nossos dados. Primeiro, abra a caixa 
de dialogo principal utilizando a sequencia 
de menu: Transform=>€ompute... 
(Transformar=>Calcular...). Entre com o 
nome logdayl (logaritmo do dia 1) no qua¬ 
dra denominado Target Variable (variavel 
alvo) e clique em e fornega a variavel 

um nome que a descreva melhor, como Loga¬ 
ritmo dos escores de higiene do primeiro dia 
do Festival de Glastonbury. Depois, role para 
baixo a lista de fungbes ate encontrar uma 
denominada LGlO(mumexpr) (Logaritmo 
decimal[expressao numerical). Destaque essa 
fungao com o mouse e a transfira para a area de 
comandos clicando em F\ Quando o comando 
e transferido, ele aparecera na area de coman¬ 
do como “LG10(?)” e o ponto de interrogagao 
deve ser substituido pelo nome da variavel (que 
pode ser digitado manualmente ou transferido 
da lista de variaveis). Assim, substitua o ? com 


Tabela 3.1 Algumas fungoes de calculo ( compute) uteis 


Fungao 

Nome 

Exemplo 

(Entrada) 

Saida 

MEAN)?, 

Media 

Mean(day1, 
day2, day3) 

Para cada linha, o SPSS calcula o valor medio 
dos escores da higiene ao longo dos tres dias do 
festival 

SD(?, 

Desvio Pa¬ 
drao 

SD(day1, 
day2, day3) 

Para cada linha, o SPSS calcula o desvio padrao 
dos valores nas colunas rotuladas como dayl, 
day2 e day3. 

SUM(?, 7,..) 

Soma 

Sum(day1, 

day2) 

Para cada linha, o SPSS adiciona o valor das li- 
nhas das colunas denominadas dayl e day2. 

SQRT(?) 

Raiz Qua¬ 
drada 

SQRT(day2) 

Produz uma nova coluna que content a raiz qua¬ 
drada de cada valor da coluna denominada day2. 
Util para transformar dados assimetricos ou da¬ 
dos com variancias heterogeneas. 

ABS(?) 

Valor Abso- 
luto 

AESS(dayl) 

Produz uma variavel que content o valor absoluto 
dos valores da coluna denominada dayl (valores 
absolutos sao aqueles em que todos os resulta- 
dos sao positivos. Assim, 5 torna-se 5. 

LG 10(?) 

Logaritmo 
de base 10 

LGIO(dayl) 

Produz uma variavel que content os logaritmos 
(Base 10) dos valores do primeiro dia. E util para 
transformar dados com assimetria positiva. 

NORMAL(stddev) 

Numeros 

Normal(5) 

Produz uma variavel contendo numeros pseudo- 


Aleatorios aleatorios de uma distribuigao normal com media 

Normals 0 e um desvio padrao de 5. 
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o nome da variavel digitando dayl. Agora, note 
que nos escores do primeiro dia existe um valor 
igual a 0. Para resolver esse problema, deve- 
mos adicionar uma constante aos escores origi¬ 
nals antes de calcular os logaritmos. Qualquer 
constante podera ser utilizada, desde que ela 
fatja com que todos os escores sejam maiores 
do que zero. Nesse caso, o nosso menor escore 
e zero, entao iremos simplesmente adicionar o 
valor 1 a todos os valores e isso ira assegurar 
que todos sejam maiores do que zero. Para fa- 
zer isso, assegure-se de que o cursor esteja den- 
tro dos parenteses e clique em _i_ e depois em 
Jj. A caixa de dialogo final deve ser semelhan- 
te a da Figura 3.8. Note que a expressao que se 
le LG 10(dayl + 1) fara com que o SPSS adi- 
cione Dayl a todos os escores do primeiro dia e 
depois obtenha o logaritmo do valor resultante. 
Clique em <* para criar a nova variavel log- 
dayl contendo os valores transformados. Ago¬ 
ra repita o processo para criar de maneira se- 
melhante as variaveis logday2 e logday3 para 
os dados dos dias 2 e3! 

Agora que sabemos como log-transformar 
dados, podemos experimentar outros tipos de 


transformacao. Por exemplo, se quisermos uti- 
lizar a transformacao raiz quadrada, podemos 
seguir o mesmo processo, utilizando um nome 
para a variavel resultante como sqrtdayl e 
selecionando a fungao SQRT(numexpr) da lis- 
ta. Ela aparecera no quadro denominado nu¬ 
meric expression (expressao numerica) como 
SQRT(?) e voce pode simplesmente substituir 
o ponto de interrogacao com a variavel que 
quiser alterar - nesse caso, dayl (dial). A ex¬ 
pressao final sera SQRT(dayl). Novamente, 
tente repetir isso para as variaveis day2 e day3 
a fim de criar novas variaveis denominadas 
sqrtday2 e sqrtday3. 

Finalmente, se voce quiser utilizar a trans¬ 
formacao recfproca nos dados do dia 1, utilize 
um nome como recdayl e simplesmente cli¬ 
que em _Ll e depois em _il. Normalmente, voce 
selecionara no nome da variavel que quiser 
transformar da lista e ira transferi-la clicando 
em _lJ (ou entao digitando o nome da variavel). 
No entanto, o dia dois contem um valor zero e, 
se tentarmos dividir por zero, obteremos uma 
mensagem de erro (you can’t divide by 0- voce 
nao pode dividir por 0). Nesse caso, precisa- 
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Figura 3.8 Caixa de dialogo para a fungao compute (calcular). 
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mos adicionar uma constante a nossa variavel 
da mesma forma que foi feito com a transferr¬ 
in agao logarftmica. Qualquer constante pode 
ser utilizada, mas 1 e um valor conveniente 
para esses dados. Assim, em vez de selecionar 
a variavel que queremos transformar, clique 
em -11. Isso acrescentara parenteses ao quadra 
denominado numeric expression (expressao 
numerica), assim, assegure-se de que o cursor 
esteja entre os parenteses e selecione a variavel 
que voce quer transformar da lista e transfira 
para o painel utilizando a seta _lJ (ou digite o 
nome da variavel manualmente). Agora, clique 
em _*J e entao em Jj (ou digite + 1 utilizan¬ 
do o teclado). O quadra denominado Numeric 


Expression (expressao numerica) deve agora 
conter o seguinte texto l/(dayl + 1). Clique 
em para criar a nova variavel contendo os 
valores transformados. Repita esse processo 
para os dados dos dois dias restantes. Se voce 
estiver calculando muitas variaveis, podera ser 
mais rapido utilizar a janela de sintaxe como 
explicado no Quadra 3.3. 

Vamos dar uma olhada nas nossas novas 
distributes (Figura 3.9). Compare-as com as 
distributes originais (nao transformadas) na 
Figura 3.5. Agora, voce pode ver que todas as 
tres transformagbes limparam os dados dos es- 
cores da higiene para o dia 2: a assimetria po- 
sitiva desapareceu (a transformacao pela raiz 



Quadro 3.3 


Utilizando sintaxe para calcular novas variaveis 


Se voce estiver calculando muitas variaveis, pode ser mais rapido utilizar a 
sintaxe - por exemplo, para criar os dados transformados no exemplo deste capi- 
tulo. No site www.artmed.com.br, ha um arquivo de sintaxe, Transformations.sps, 
que escrevi para todas as nove transformagoes discutidas. Carregue esse arquivo 
e rode a sintaxe ou abra a janela de sintaxe (veja a Segao 2.6) e digite o seguinte: 

logdayl = LG10(day1 + 1). 
logday2 = LG10(day2 + 1). 
logday3 = LG10(day3 + 1). 
sqrtdayl = SQRT(dayl). 
sqrtday2 = SQRT(day2). 
sqrtday3 = SQRT(day3). 
recdayl = 1 /(day 1 + 1). 
recday2 = 1/(day2 + 1). 
recday3 = 1/(day3 + 1). 


COMPUTE 

COMPUTE 

COMPUTE 

COMPUTE 

COMPUTE 

COMPUTE 

COMPUTE 

COMPUTE 

COMPUTE 

EXECUTE 


Cada comando COMPUTE (Calcular) faz o mesmo que voce faria utilizando a caixa de dialogo 
na Figura 3.8. Assim, as tres primeiras linhas simplesmente solicitam que o SPSS crie tres novas 
variaveis (logayl, logday2 e logday3), que sao as transformagoes logaritmicas das variaveis day 1 
(dia 1), day2 (dia 2) e day3 (dia 3) mais 1. As proximas tres linhas fazem a mesma coisa so que 
agora utilizando a fungao SORT e, assim, calculam a raiz quadrada de dayl, day2 e 
day3 criando as novas variaveis sqrtdayl, sqrtday2 e sqrtday3, respectivamen- 
te. As proximas tres linhas executam a transformagao reciproca da mesma for¬ 
ma que as outras 2 fungoes fizeram. A linha final apresenta o comando EXECU¬ 
TE (Executar) sem o qual nenhum dos anteriores sera processado! Note ainda 
que cada uma das linhas termina com um ponto final. 
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Dia 1 em Glastonbury 


Dia 2 em Glastonbury 



Logaritmo dos escores transformado 
para o Dia 1 de Glastonbury 



Raiz Quadrada dos escores da higiene 
para o Dia 1 de Glastonbury 



Reciprocos dos escores da higiene 
para o Dia 1 de Glastonbury 


Figura 3.9 Distribuigao dos dados da higiene do 


quadrada, em particular, foi util). No entanto, 
em virtude dos nossos escores da higiene no 
dia 1 nao terem assimetria significativa, eles 



Logaritmo dos escores transformado 
para o Dia 2 de Glastonbury 



Raiz Quadrada dos escores da higiene 


para o Dia 2 de Glastonbury 



0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95 

0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00 

Reciprocos dos escores da higiene 
para o Dia 2 de Glastonbury 

dia 1 e do dia 2 apos as transformagoes. 


agora apresentam uma leve assimetria negati- 
va para a transformacao logarftmica e da raiz 
quadrada e assimetria positiva para a transfer- 
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ma^ao reciprocal 5 Se estivermos utilizando 
apenas os escores do segundo dia, podemos 
utilizar os dados transformados; no entanto se 
quisermos verificar os dois dias em conjun- 
to, teremos que ponderar se os beneffcios da 
transformacao sobre os dados do segundo dia 
nao sao sobrepujados pelos problemas criados 
com os dados do primeiro dia - a analise de 
dados pode ser frustrante as vezes! 

Se a transformacao corrige os problemas, 
execute qualquer analise estatistica que voce 
precise sobre os escores transformados. Se ela 
nao corrigir o problema, voce pode considerar 
a utilizagao de um teste que nao tenha por base 
a hipotese de dados normalmente distribufdos 
e, a medida que voce percorrer os varios capf- 
tulos do livro apresentarei esses testes. 6 

3.4 EXPLORANDO GRUPOS DE DADOS © 

Algumas vezes temos dados em que exis- 
tem diferentes grupos de pessoas (homens e 
mulheres, universidades diferentes, pessoas 
com e sem depressao, por exemplo). Existem 
varias maneiras de produzir estatfsticas basi- 
cas para grupos separados de pessoas (e ve- 
remos esses metodos na proxima secao). No 
entanto, pretendo utilizar essa oportunidade 
para lhe apresentar uma funcao denominada 
split file (dividir arquivo), que permite repetir 
qualquer analise sobre varios grupos de casos. 
A funcao split file (dividir arquivo) permite 
especificar uma variavel de grupo (lembre que 
essas variaveis sao utilizadas para especificar 
categorias de pessoas). Qualquer procedimen- 
to posterior no SPSS ira ser executado em 
cada uma das categorias especificadas pela 
variavel de grupo. 


5 A inversao da assimetria que aconteceu com a trans¬ 
form actio recfproca ocorre, como mencionada antes, 
porque essa transformacao inverte o valor dos escores. 

6 Por conveniencia, muitos livros-texto se referem a es¬ 
ses testes como nao-parametricos ou distribuigoes ti- 
vres e os colocam em um capftulo separado. De fato, 
nenhum desses termos e particularmente preciso (pois 
nenhum desses testes esta livre de suposicoes). mas, 
para manter a tradifao, eu os coloquei em um capftulo 
(13) proprio, no ostracismo e solitarios. 


Voce provavel- 
mente esta cansado dos 
dados sobre a higiene 
do festival de Glaston¬ 
bury, portanto, vamos 
utilizar o arquivo de 
dados SPSSExam.sav. 

Esse arquivo content 
dados do desempenho 
de estudantes em um 
exame sobre o SPSS. Quatro variaveis foram 
mensuradas: exam (exame) (escores dos exa- 
mes sobre o SPSS de alunos do primeiro ano 
em percentagem), computer (computador) 
(o conhecimento computacional mensurado 
em percentual), lecture (aulas) (percentual de 
aulas sobre o SPSS frequentadas) e numeracy 
(numeracia) (uma medida da habilidade nu- 
merica em uma escala de 1 a 15). Existe ainda 
uma variavel denominada uni indicando se o 
estudante frequenta a Universidade de Sus¬ 
sex ou a de Duncetown*. Para iniciar, abra o 
arquivo SPSSExam.sav (veja a Secao 2.8 se 
nao lembrar como abrir um arquivo). Vamos 
comecar olhando os dados como um todo. 

3.4.1 Executando a analise para todos 
os dados CD 

Para olhar a distribuicao das variaveis, 
podemos utilizar o comando frequencies (fre¬ 
quences), apresentado na secao anterior (veja 
a Figura 3.6). Utilize essa caixa de dialogo e 
coloque todas as quatro variaveis (exam, com¬ 
puter, lecture e numeracy) no quadro varia¬ 
ble (s) (variavel [is]). Clique em sui**. para 
selecionar a caixa de dialogo statistics (estatfs¬ 
ticas) e selecione algumas medidas de tenden- 
cia central (media, moda e mediana), medidas 
de variabilidade (amplitude, desvio padrao, 
variancia e quartis) e medidas de forma (as¬ 
simetria e curtose). Clique tambem em 
para acessar a caixa de dialogo dos diagramas 
e selecione a distribuicao de frequences com 
a curva normal (veja a Figura 3.6 se precisar 


N. de T.: E um nome fictfcio, atribufdo pelo autor, 
que em portugues significa cidade dos burros. 
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de ajuda com essa opcao). Retorne a caixa de 
dialogo principal e clique em e, uma vez 
nela, clique em <* para executar a analise. 

3.4.2 Saida do SPSS para todos os 
dados © 

A safda 3.2 do SPSS mostra a tabela das 
estatfsticas descritivas para as quatro variaveis 
deste exemplo. A partir dessa tabela, e possf- 
vel ver que, em media, os estudantes frequen- 
taram aproximadamente 60% das aulas, eles 
obtiveram 58% no exame do SPSS, tiveram 
somente 51% no teste de conhecimento ou 
habilidade computacional e apenas 5 em uma 
escala ate 15 em numeracia, isto e, habilidade 
numerica. Alem disso, o desvio padrao para 
a habilidade computacional foi relativamente 
pequeno comparado ao do percentual de aulas 
freqiientadas e as notas do exame. Essas ulti¬ 
mas duas variaveis apresentaram varias modas 
(multimodais). As outras medidas importantes 
sao a assimetria e a curtose, ambas apresen- 
tando um erro padrao associado. Ja discuti- 


mos essas medidas anteriormente e verifica- 
mos que podemos converte-las em escores-z 
dividindo-as pelos seus erros padroes. Para os 
escores do exame, o escore-z da assimetria e 
—0,107/0,241 = —0,44. Para a numeracia, o 
escore-z da assimetria foi de 0,961/0,241 = 
3,99. Fica evidente que os escores da numera¬ 
cia apresentam assimetria positiva, indicando 
uma conccntracao de valores na parte esquer- 
da da distribuicao (isto e, muitos estudantes 
pontuaram mal). Tente calcular o escore-z 
para as demais variaveis. 

A safda fornece tabelas das distributes 
de freqiiencias de cada uma das variaveis (que 
nao sao apresentadas aqui). Essas tabelas lis- 
tam cada escore e o numero de vezes que ele 
ocorreu no conjunto de dados. Adicionalmen- 
te, cada valor da freqiiencia e expresso como 
um percentual da amostra (nesse caso, as fre¬ 
quences e as percentagens sao as mesmas, 
pois o tamanho da amostra e igual a 100). 
Tambem, a percentagem acumulada e dada, 
que nos informa quantos casos estao abaixo 


Saida 3.2 do SPSS 


Statistics (Estatisticas) 



Computer 

literacy 

(Conhecimento 

Computacional) 

Percentage on 
SPSS Exam 
(Percentual no 
Exame do SPSS) 

Percentage of 
lectures attended 
(Percentual de 
comparecimento 
as aulas) 

Numeracy 

(Numeracia) 

N Valid (Validos) 

100 

100 

100 

100 

Missing 

0 

0 

0 

0 

(Desconhecidos) 

Mean (Media) 

50.7100 

58.1000 

59.7650 

4.8500 

Std. Error of Mean (Erro Padrao da 

0.8260 

2.1316 

2.1685 

0.2706 

Media) 

Median (Mediana) 

51.5000 

60.0000 

62.0000 

4.0000 

Mode (Moda) 

54.00 

72.00 a 

48.50“ 

4.00 

Standard Deviation (Desvio Padrao) 

8.2600 

21.3156 

21.6848 

2.7057 

Variance (Variancia) 

68.2282 

454.3535 

470.2296 

7.3207 

Skewness (Assimetria) 

-0.174 

-0.107 

-0.422 

0.961 

Std. Error of Skewness (Erro Padrao da 

0.241 

0.241 

0.241 

0.241 

Assimetria) 

Kurtosis (Curtose) 

0.364 

-1.105 

-0.179 

0.946 

Std. Error of Kurtosis (Erro Padrao da 

0.478 

0.478 

0.478 

0.478 

Curtose) 

Range (Amplitude) 

46.00 

84.00 

92.00 

13.00 

Minimum (Minimo) 

27.00 

15.00 

8.00 

1.00 

Maximum (Maximo) 

73.00 

99.00 

100.00 

14.00 


a. Existem multiplas modas. 0 menor valor e mostrado. 
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de certo valor. Assim, por exemplo, podemos 
ver que 66% dos escores da numeracia foram 
5 ou menos, 74% foram 6 ou menos, e assim 
por diante. Olhando em outra diregao, pode¬ 
mos perceber que somente 8% (100% — 92%) 
tiveram um escore maior do que 8. 

Finalmente, foram obtidos os histogramas 
de cada uma das variaveis sobrepostos por uma 
distribuigao normal. Esses graficos sao apre- 
sentados na Figura 3.10 e nos mostram varias 
coisas. Primeiro, parece que o conhecimento 
computacional tem distribuigao aproximada- 
mente normal (poucas pessoas sao muito boas 
e poucos sao muitos ruins com computadores, 
a maioria tem um grau de conhecimento si¬ 
milar). Os escores do exame sao bem interes- 
santes porque essa distribuigao e claramente 
nao-normal; de fato, ela parece suspeitamente 


bimodal (existem dois picos indicando duas 
modas). Essa observagao corresponde a uma 
anterior da tabela das estatfsticas descritivas. O 
comparecimento as aulas e aparentemente nor¬ 
mal, mas as caudas da distribuigao sao bastante 
pesadas (isto e, embora muitas pessoas compa- 
regam a maioria das aulas, existe um numero de 
almas dedicadas que comparecem a todas e um 
grupo maior do que o “normal” que compare¬ 
cem a poucas). Esse e o motivo dela apresentar 
altas frequences nas duas caudas. Finalmente, 
o teste de numeracia produziu dados com uma 
assimetria positiva acentuada (isto e, a maioria 
das pessoas foi muito mal nesse teste e poucos 
foram bem). Isso corresponde ao que a estatfs- 
tica de assimetria ja havia indicado. 

Estatfsticas descritivas e histogramas sao 
boas formas de obter um retrato instantaneo 



Desvio Padrao 
= 8,26 

Media = 50,7 
N = 100 



Desvio Padrao 
= 21,32 
Media = 58,1 
N = 100 


Conhecimento computacional 


Percentual no exame do SPSS 



Percentual de aulas frequentadas Numeracia 


Figura 3.10 Histograma dos dados do exame sobre o SPSS. 
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da distribuigao dos dados. Essa compreensao 
podera ser bastante util: por exemplo, a dis¬ 
tribuigao bimodal nos escores do exame do 
SPSS indica que os estudantes sao tipicamen- 
te muito bons em estatfstica ou tern dificul- 
dades com ela (existem relativamente poucos 
que estao entre esses dois extremos). Intuiti- 
vamente, esse achado se ajusta a natureza do 
conteudo: estatfstica e muito facil uma vez 
que tudo esteja no devido lugar, mas antes 
que tal encantamento ocorra, ela parece ser 
desesperadamente diffcil! Embora existam 
muitas informagoes que podemos obter a par- 
tir dos histogramas e informagoes descritivas 
sobre a distribuigao, existem maneiras mais 
objetivas na qual podemos verificar o grau de 
normalidade em um conjunto de dados (veja 
a Segao 3.5). 

3.4.3 Executando a analise para grupos 
diferentes ® 

Se voce quiser obter estatfsticas separadas 
para cada uma das universidades, podemos di- 
vidir o arquivo e seguir utilizando o comando 
frequencies (frequences) descrito na segao 
anterior. Para dividir o arquivo, basta utilizar 
o seguinte caminho de menu: Data=>Split 
File... (Dados=> Dividir Arquivo...) ou clicar 
em 3. Na caixa de dialogo resultante (Figura 
3.11), selecione a opgao Organize output by 
groups (Organize a safda por grupos). O qua¬ 
dra Groups Based on (Grupos baseados em) 
sera ativado. Selecione a variavel contendo 


o codigo dos grupos para o qual voce dese- 
ja repetir a analise (nesse exemplo, selecione 
Uni) e a transfira para o quadro clicando em 
jJ. Por padrao, o SPSS ira ordenar o arquivo 
por esses grupos (isto e, ele listara uma cate- 
goria seguida pela outra na janela do editor 
de dados). Uma vez que voce tenha dividido 
o arquivo, utilize o comando frequencies (fre¬ 
quencias) (veja a segao anterior). Solicitei es¬ 
tatfsticas apenas para as variaveis numeracy e 
exam. Voce podera selecionar as outras varia¬ 
veis se desejar. 

3.4.4 Saidas para grupos diferentes (D 

A safda do SPPS e dividida em duas se- 
goes: primeiro os resultados dos estudantes 
da universidade de Duncetown e depois os 
da universidade de Sussex. A safda do SPSS 
3.3 mostra as duas principals tabelas. A partir 
dessas tabelas, fica claro que os alunos da uni¬ 
versidade de Sussex tiverem escores maiores 
tanto no exame do SPSS quanto no teste de 
numeracia do que os alunos de Duncetown. 
De fato, olhando para as medias, percebe-se 
que os estudantes de Sussex tiveram um ren- 
dimento 6% maior no exame do SPSS e tive¬ 
ram escores no teste de numeracia duas vezes 
maior. Os desvios padroes para as duas varia¬ 
veis sao levemente maiores para a universida¬ 
de de Sussex, mas nao muito. 

A Figura 3.12 mostra os histogramas 
dessas variaveis separados pelas universida¬ 
des frequentadas. A primeira coisa interes- 



Figura 3.11 Caixa de dialogo para o comando split file (dividir arquivo). 
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Saida 3.3 do SPSS 

Estatisticas da Universidade de Duncetown b Estatisticas da Universidade de Sussex b 



Percentage on 
SPSS Exam 
(Percentual 
no Exame 
do SPSS) 

Numeracy 

(Numeracia) 



Percentage on 
SPSS Exam 
(Percentual 
no Exame 
do SPSS) 

Numeracy 

(Numeracia) 

N Valid (Validos) 

50 

50 


N Valid (Validos) 

50 

50 

Missing 

0 

0 


Missing 

0 

0 

(Desconhecidos) 




(Desconhecidos) 



Mean (Media) 

40.1800 

4.1200 


Mean (Media) 

76.0200 

5.5800 

Std. Error of Mean (Erro 

1.78032 

0.29227 


Std. Error of Mean (Erro 

1.44321 

0.43433 

Padrao da Media) 




Padrao da Media) 



Median (Mediana) 

38.0000 

4.0000 


Median (Mediana) 

75.0000 

5.0000 

Mode (Moda) 

34.00 a 

4.00 


Mode (Moda) 

72.00“ 

5.00 

Standard Deviation (Des- 

12.58877 

2.06664 


Standard Deviation (Des- 

10.20502 

3.07120 

vio Padrao) 




vio Padrao) 



Variance (Variancia) 

158.47714 

4.27102 


Variance (Variancia) 

104.14245 

9.43224 

Skewness (Assimetria) 

0.309 

0.512 


Skewness (Assimetria) 

0.272 

0.793 

Std. Error of Skewness 

0.337 

0.337 


Std. Error of Skewness 

0.337 

0.337 

(Erro Padrao da Assime- 




(Erro Padrao da Assime- 



tria) 




tria) 



Kurtosis (Curtose) 

-0.567 

-0.484 


Kurtosis (Curtose) 

-0.264 

0.260 

Std. Error of Kurtosis 

0.662 

0.662 


Std. Error of Kurtosis 

0.662 

0.662 

(Erro Padrao da Curtose) 




(Erro Padrao da Curtose) 



Range (Amplitude) 

51.00 

8.00 


Range (Amplitude) 

43.00 

13.00 

Minimum (Minimo) 

15.00 

1.00 


Minimum (Minimo) 

56.00 

1.00 

Maximum (Maximo) 

66.00 

9.00 


Maximum (Maximo) 

99.00 

14.00 


a. Multiple modes exist. The smallest value is shown (Ex¬ 
istent multiplas modas. E mostrado o menor valor.) 

b. University Duncetown University 


a. Multiple modes exist. The smallest value is shown (Ex¬ 
istent multiplas modas. E mostrado o menor valor.) 

b. University Sussex University 


sante a ser notada e que para as notas dos 
exames, as distribuigoes sao praticamente 
normais. Isso parece estranho porque a dis¬ 
tribuigao e bimodal. No entanto, isso comega 
a fazer sentido quando voce considera que 
para Duncetown a distribuigao esta centrada 
em torno do valor de 35%, mas para Sussex a 
distribuigao esta centrada em torno do valor 
75%. Isso mostra como e importante verifi- 
car a distribuigao dentro dos grupos. Se esta- 
mos interessados em comparar Duncetown e 
Sussex, nao importa que a distribuigao global 
dos valores seja bimodal; tudo o que importa 
e que cada grupo seja originario de uma dis¬ 
tribuigao normal e, nesse caso, isso aparenta 
ser verdadeiro. Quando as duas amostras sao 
combinadas, essas duas distribuigoes nor¬ 
mais criam uma distribuigao bimodal (com 
uma das modas estando em torno do cen¬ 
tra da distribuigao de Duncetown e a outre 


em torno do centra dos dados de Sussex!). 
Para os escores da numeracia, a distribui¬ 
gao apresenta uma assimetria positiva leve 
no grupo de Duncetown (existe uma grande 
concentragao nos escores mais baixos); os 
escores de Sussex apresentam tambem uma 
leve assimetria positiva, mas os escores sao 
em geral mais altos do que os de Duncetown. 
Dessa forma, a assimetria positiva observa- 
da para todos os dados anteriormente e uma 
contribuigao dos escores dos alunos das duas 
universidades. Quando voce tiver terminado 
com o comando split (dividir), lembre-se de 
desliga-lo ou voltar atras (senao o SPPS ira 
fazer todas as demais analises em cada grupo 
separadamente). Para voltar atras com esse 
comando, retorne a caixa de dialogo splitfile 
(dividir arquivo) e selecione Analyze all ca¬ 
ses, do not create groups (Analise todos os 
casos, nao crie grupos). 
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Notas do exame do SPSS 


Universidade de Duncetown 



Desvio Padrao 
= 12,59 
Media = 40,2 
N = 50 


15,0 25,0 35,0 45,0 55,0 65,0 

20,0 30,0 40,0 50,0 60,0 


Universidade de Sussex 



Desvio Padrao 
= 10,21 
Media = 76,0 
N = 50 


Percentual no exame do SPSS 


Numeracia 


Percentual no exame do SPSS 


Universidade de Duncetown 



Desvio Padrao 
= 2,07 
Media = 4,1 
N = 50 


Numeracia 


Universidade de Sussex 



Desvio Padrao 
= 3,07 
Media = 5,6 
N = 50 


Figura 3.12 Distribuigoes dos escores no exame e na numeracia para os estudantes das univer- 
sidades de Duncetown e Sussex. 


3.5 TESTAND0 SE UMA DISTRIBUICA0 


Olhar para os 
histogramas e uma 
opgao, mas eles nada 
informant sobre a 
distribuigao estar 
proxima o suficiente 
da normalidade. A 
analise do histogra- 
ma e subjetiva e 
aberta a abusos (Pos- 
so imaginar pesquisadores sentados olhando 
para uma distribuigao completamente distorcida 
e dizendo “bem Carlos, ela parece normal para 
mim” e Carlos replicando “com certeza”). O 
que e necessario e um teste objetivo para decidir 
se uma distribuigao e ou nao-normal. As estatfs- 
ticas de assimetria e curtose que vimos antes 


informam um pouco sobre desvios da normali¬ 
dade, mas cada uma delas lida com apenas um 
aspecto da nao-normalidade. Outra ntaneira de 
tratar o problema e ver se a distribuigao como 
um todo se desvia de uma distribuigao normal 
modelo. Os testes de Kolmogorov-Smirnov (Fi¬ 
gura 3.13) e de Shapiro-Wilk fazem justamente 
isso: eles comparam escores de uma amostra a 
uma distribuigao normal modelo de mesma me¬ 
dia e variancia dos valores encontrados na 
amostra. Se o teste e nao-significativo (p > 0,05), 
ele nos informa que os dados da amostra nao 
diferem significativamente de uma distribuigao 
normal (isto e, eles podem ser normais). Por ou- 
tro lado, se o teste e significativo (p < 0,05), a 
distribuigao em questao e significativamente di- 
ferente de uma distribuigao normal (isto e, ela e 
nao-normal). Esses testes parecem otimos: em 

um procedimento eles nos dizem se os nossos 
escores sao normalmente distribufdos (beleza!). 


E NORMAL © 
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Figura 3.13 Andrei Kolmogorov, querendo ter 
uma Smirnov. 


Entretanto, eles apresentam limitagoes porque 
com amostras grandes e muito facil obter valo- 
res significativos a partir de pequenos desvios 
da normalidade e, assim, um resultado significa- 
tivo nao necessariamente nos informa se o des- 
vio da normalidade e suficiente para prejudicar 
os procedimentos estatfsticos que serao aplica- 
dos aos dados. Acredito que o sensato a fazer e: 
de qualquer forma utilize esses testes, mas faga 
diagramas dos dados bem como tente obter uma 
decisao sobre a extensao da nao-normalidade. 

3.5.1 Executando o teste de 

Kolmogorov-Smirnov no SPSS © 

O teste de Kolmogorov-Smirnov (K-S de 
agora em diante) pode ser acessado pelo coman- 
do explore (explorar) Analyze=> Descriptive 
Statistics=>Explore... (Analisar=>Estatistica 
Descritiva=> Explorar.. .), 7 A Figura 3.14 mos- 
tra a caixa de dialogo para o comando explore 
(explorar). Primeiro, entre com qualquer varia- 
vel de interesse no quadro denominado Depen¬ 
dent list (Lista Dependente) selecionando-as 
no lado esquerdo e transferindo para o direito 
clicando em _il. Para esse exemplo, apenas 


7 Esse caminho seria Statistics=>Summarize=>Explo- 
re... (Estatfsticas=>Resumir=>Explorar...) na versao 
8.0 e anteriores. 


selecione os valores das variaveis exame e 
numeracia. E tambem possfvel selecionar um 
fator (variavel de grupo) pelo qual podemos 
dividir a saida - (assim, se voce selecionar uni 
e transferi-la para o quadro denominado Fac¬ 
tor List [Lista de fatores], o SPSS ira produ- 
zir uma analise exploratoria para cada um dos 
grupos - parecido com o comando split file 
[dividir arquivo]. Se voce clicar em .sum*. , 
uma caixa de dialogo aparece, mas a opgao por 
omissao e suficiente (produzira medias, des¬ 
vios padrao e assim por diante). A opgao mais 
interessante para o nosso objetivo e acessada 
clicando em , que abrira uma nova caixa 
de dialogo onde voce pode selecionar a opgao 
j sso j r; i produzir tanto um teste 
K-S quanto um grafico denominado normal 
Q-Q plots (diagramas Q-Q normais)* para 
todas as variaveis selecionadas. Por omissao, 
o SPSS tambem ira apresentar diagramas de 
caixa e bigodes. Separado por grupos se um 
fator foi especificado) e tambem um diagrama 
de caule e folhas. Clique em c "*~ para retornar 
a caixa de dialogo principal e clique em <* 
para executar a analise. 

3.5.2 Saida do procedimento Explore 
(Explorar) © 

A primeira tabela produzida pelo SPSS 
content estatfsticas descritivas (medias, etc.) e 
deve ter os mesmos valores que a tabela obti- 
da com a utilizagao do procedimento frequen- 
cias (frequencies ). A tabela importante e a do 
teste K-S. 

Essa tabela inclui o proprio teste, os graus 
de liberdade (que devem ser iguais ao tama- 
nho da amostra) e os valores da significancia 
do teste. Lembre que um valor significativo 
(Sig. < 0,05) indica um desvio da normali¬ 
dade. Tanto para os valores do exame quanto 
para os da numeracia o teste K-S e altamente 


* N. de T.: Um diagrama Q-Q e um grafico onde o quan- 
til do primeiro conjunto de dados e apresentado contra 
o quantil de um segundo conjunto de dados. Por quan- 
til entendemos um determinado percentual de valores 
abaixo de um dado valor. Alguns quantis especiais sao: 
quartis, decis e percentis. 
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Tests of Normality (Testes de normalidade) 



Kolmogorov-Smirnov 3 

Shapiro-Wilk 


Statistic 

(Estatistica) 

Df 

(gi) 

Slg. 

(Significance) 

Statistic 

(Estatistica) 

Df 

(gi) 

Sig. 

(Significance) 

Percentage on SPSS exam 
(Percentual no exame do SPSS) 

0.102 

100 

0.012 

0.961 

100 

0.005 

Numeracy (Numeracia) 

0.153 

100 

0.000 

0.924 

100 

0.000 


a. Corregao de significance de Lilliefors. 
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Figura 3.14 Caixas de dialogo para o comando explore (explorar). 


significative), indicando que as duas distribu¬ 
tes se desviam da normalidade. Esse resul- 
tado provavelmente reflete a distribuigao bi- 
modal encontrada para os escores do exame e 
a distrihuicao com assimetria positiva obser- 
vada para os escores da numeracia. Entretan- 
to, esses testes confirmam que esses desvios 
eram significativos. Essa confirmacao e im- 
portante porque os histogramas nos informant 


apenas que nossas distributes amostrais se 
desviam da normalidade; eles nao nos dizem 
se esse desvio e importante. A estatistica teste 
para o teste K-S e representada por D, assim, 
podemos relatar esses resultados da seguinte 
forma. A percentagem no exame do SPSS, 
D(100) = 0,10, p < 0,05, e para os escores da 
numeracia, D(100) = 0,15, < 0,001, foram 

ambos significativamente nao-normais. Os 
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numeros nos parenteses sao os graus de liber- 
dade (gl) da tabela. 

Concluindo, tenha em mente que quando 
olhamos os escores dos exames considerando 
grupos separadamente, as distributes pare- 
cem praticamente normais; mas se executar- 
mos testes separados para as duas universi- 
dades (colocando uni na caixa denominada 
Factor List [Lista de Fatores], como na Figura 
3.17) o teste K-S podera ser nao-significativo. 
De fato, se voce fizer isso, obtera a salda 3.4 
do SPSS na forma de tabela, que mostra que 
os percentuais do exame sobre o SPSS sao, de 
fato, normais entre os dois grupos* (os valo- 


* N. de T.: Como a hipotese nula nao esta sendo rejei- 
tada aqui, eu colocaria que “as distributes sao possi- 
velmente normais” em vez de “de fato normais”, como 
o autor coloca. 


res na coluna denominada Sig. sao maiores do 
que 0,05). Isso e importante porque se nossa 
analise envolve a comparagao entre dois gru¬ 
pos, o que importa nao e a distribuigao global, 
mas a distribuigao de cada grupo. 

O SPSS tambem produz um diagrama 
Q-Q normal para qualquer variavel especifica- 
da (veja a Figura 3.15). O diagrama Q-Q nor¬ 
mal traga os valores que esperarfamos obter se 
a distribuigao fosse normal (valores esperados) 
contra os valores realmente vistos nos dados 
(valores observados). Os valores esperados 
sao uma linha reta na diagonal do primeiro 
quadrante do sistema de coordenadas, onde os 
valores observados (os pontos no diagrama) 
devem cair exatamente ou bem proximos da 
linha (significando que os valores observados 
sao os mesmos que se esperaria obter de um 
conjunto normalmente distribuldo). Qualquer 


Saida 3.4 do SPSS 

Tests of Normality (Testes de normalidade) 




Kolmogorov-Smirnov a 

Shapiro-Wilk 



Statistic 

Df 

Sig. 

Statistic 

Df 

Sig. 

University (Universidade) 

(Estatistica) 

(gl) 

(Signf.) 

(Estatistica) 

(gl) 

(Signf.) 

Percentage on SPSS exam 

Duncetown 

0.106 

50 

0.200* 

0.972 

50 

0.238 

(Percentual no exame do 

Sussex 

0.073 

50 

0.200* 

0.984 

50 

0.715 

SPSS) 

Numeracy (Numeracia) 

Duncetown 

0.183 

50 

0.000 

0.941 

50 

0.015 



0.155 

50 

0.004 

0.932 

50 

0.007 


* Esse e um limite inferior da verdadeira significance, 
a. Corregao de significance de Lilliefors. 


Diagrama normal para os escores 
do exame do SPSS 


Diagrama normal dos 
escores da Numeracia 




Figura 3.15 Diagramas Q-Q normais das variaveis escores no Exame do SPSS e na numeracia. 
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desvio dos pontos em relagao a linha reta dia¬ 
gonal representa um desvio da normalidade. 
Assim, se o diagrama Q-Q se parece com uma 
linha reta com uma longa cobra serpenteando 
ao redor, voce tern alguns desvios da norma¬ 
lidade! Especificamente, quando a linha fica 
de forma consistente abaixo da diagonal ou 
acima, isso esta mostrando que a curtose e 
diferente de uma distribuigao normal e, quan¬ 
do os pontos apresentarem uma forma de S, o 
problema sera com a assimetria. 

Em ambas as variaveis analisadas ja sa- 
bemos que os dados sao nao-normais e esses 
diagramas confirmam essa observagao porque 
os pontos se desviam substancialmente da li¬ 
nha. Vale a pena notar que os maiores desvios 
ocorrem com a variavel numeracia e isso esta 
de acordo com o valor altamente significativo 
da variavel no teste K-S. Tal desvio da norma¬ 
lidade nos informa que nao podemos utilizar 
um teste parametrico porque a hipotese de 
normalidade nao se verifica. Nessas circuns- 
tancias, podemos em alguns casos considerar 
a utilizacao de um teste nao-parametrico como 
forma de verificar a hipotese de interesse (veja 
o Capftulo 4). 

3.6 TESTANDO A HOMOGENEIDADE DA 
VARIANCIA ® 

Ate agora, me concentrei na hipotese de 
dados normalmente distribufdos; entretanto, 
no infcio do Capitulo 1 mencionei outra supo- 
sigao, a homogeneidade da variancia. Essa hi¬ 
potese significa que a medida que voce avanga 
entre os nfveis de uma variavel, a variancia da 
outra nao deve mudar. Se voce coletou grupos 
de dados, isso significa que a variancia da sua 
variavel ou variavel de safda deve ser a mesma 
em cada um desses grupos. Se voce coletou 
dados contfnuos (como os delineamentos in- 
tercorrelacionais), essa suposigao significa 
que a variancia de uma variavel deve ser es- 
tavel em todos os nfveis da outra variavel. Va- 
mos ilustrar com um exemplo. Uma otologista 
esta interessada no efeito dos altos sons dos 
concertos sobre a audigao dos frequentadores. 
Assim, ela decidiu enviar 10 pessoas a uma 


turne com a banda mais barulhenta que ela 
pode encontrar, Motorhead. Essas pessoas fo- 
ram a shows em Brixton (Londres), Brighton, 
Bristol, Edinburgo, Newcastle, Cardiff e Du¬ 
blin. Apos cada show, a otologista media o nu- 
mero de horas que as pessoas ficavam com os 
ouvidos zumbindo. 

A Figura 3.16 mostra o numero de horas 
que cada pessoa teve zumbido no ouvido apos 
cada concerto (cada pessoa esta representada 
por um cfrculo). As linhas horizontais repre- 
sentam o numero medio de horas que existiu 
zumbido nos ouvidos apos cada show e essas 
medias estao conectadas por uma linha de 
forma que podemos ver a tendencia geral dos 
dados. Lembre-se de que para cada show, os 
cfrculos sao os escores a partir do qual as me¬ 
dias sao calculadas. Agora, podemos ver nos 
dois graficos que a media aumenta a medida 
que as pessoas vao a mais shows. Assim, apos 
o primeiro show os ouvidos zumbem por apro- 
ximadamente 12 horas, mas depois do segun- 
do, eles zumbem por aproximadamente 15 a 
20 horas e na noite final da turne, eles zumbem 
por 45 a 50 horas (dois dias). Assim, existe um 
efeito acumulado dos shows sobre o zumbido 
nos ouvidos. Esse padrao e visto nos dois gra¬ 
ficos; a diferenga entre os graficos nao esta nas 
medias (que sao basicamente as mesmas), mas 
em termos do espalhamento dos escores em 
torno da media. Se olharmos para o grafico da 
esquerda, veremos que a dispersao dos escores 
permanece praticamente a mesma apos cada 
show (os escores estao na maioria agrupados 
em torno da media). Colocando de outra for¬ 
ma, se for mensurada a distancia vertical en¬ 
tre os escores mais alto e o mais baixo apos o 
show de Brixton e fizermos o mesmo apos os 
demais, todas essas distancias serao aproxima¬ 
damente iguais. Embora a media aumente, o 
espalhamento dos escores para a perda de au¬ 
digao e a mesma a cada nfvel da variavel show 
(a dispersao dos escores e a mesma apos Brix¬ 
ton, Brighton, Bristol, Edinburgo, Newcastle, 
Cardiff e Dublin). Isso e o queremos dizer por 
homogeneidade da variancia. O grafico da 
direita mostra uma situagao diferente: se voce 
examinar a dispersao dos escores apos o show 
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Show Show 

Figura 3.16 Graficos ilustrando dados com variancias homogeneas e heterogeneas. 


de Brixton, vera que estao bem concentrados 
em torno da media (a distancia vertical entre o 
maior e o menor escore e pequena), mas apos 
o show de Dublin (por exemplo) os escores 
estao bastante espalhados em torno da media 
(a distancia vertical entre o maior e o menor 
escore e grande). Esse e um exemplo de he- 
terogeneidade da variancia', isto e, em alguns 
niveis da variavel show a variancia dos escores 
e diferente dos outros niveis (nesse caso, a dis¬ 
tancia vertical entre o maior e o menor escore 
e diferente entre diferentes shows). 

Espero que voce tenha captado a ideia do 
que a homogeneidade da variancia significa. 
Mas como testa-la? Muitos procedimentos es- 
tatisticos apresentam particularidades unicas 
para faze-lo: na analise correlacional, como a 
regressao, a tendencia e utilizar graficos (veja 
a Segao 5.8.7) e para grupos de dados, a ten¬ 
dencia e utilizar o teste de Levene. O teste de 
Levene verifica a hipotese de que a variancia 
nos grupos e a mesma (isto e, a diferenca entre 
as variancias e zero). Dessa forma, se o tes¬ 
te de Levene e significativo quando p < 0,05, 
podemos concluir que a hipotese nula e incor- 
reta e que as variancias sao significativamente 
diferentes - assim, a suposigao de variancias 
homogeneas foi violada. Se, no entanto, o 
teste de Levene nao e significativo (isto e, p 


> 0,05), aceitamos a hipotese nula de que as 
diferengas entre as variancias e zero - as va¬ 
riancias sao aproximadamente iguais e a su- 
posicao e mantida. Embora o teste de Levene 
possa ser selecionado como uma opgao entre 
muitos testes estatfsticos, ele tambem pode ser 
uma alternativa quando voce esta explorando 
os dados (e e melhor faze-lo agora do que es- 
perar ate a analise principal). 

Como ocorreu com o teste K-S (e outros 
de normalidade), quando o tamanho da amos- 
tra e grande, pequenas diferengas entre as va¬ 
riancias dos grupos podem produzir um teste 
de Levene significativo (em virtude do que vi- 
mos no Capitulo 1, o poder do teste e aumenta- 
do). Uma dupla checagem util e olhar a razao 
das variancias. Isso e a razao das variancias 
entre os grupos de pessoas com a maior va¬ 
riancia e a do grupo com a menor variancia. 
Assim, se voce olhar para as variancias entre 
grupos diferentes, pegue o valor mais alto que 
encontrar e divida pelo valor mais baixo que 
encontrar. Se o resultado (razao) for menor 
que 2, e seguro afirmar que ha homogeneida¬ 
de das variancias. 

E possfvel realizar o teste de Levene utili- 
zando o menu explore (explorar) que foi usado 
na segao anterior. Para esse exemplo, pegare- 
mos os dados do exame do SPSS que foram 
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utilizados na segao anterior (estao no arquivo 
SPSSExam.sav). Uma vez que os dados te- 
nham sido carregados, isto e, o arquivo tenha 
sido aberto, utilize Analyze=>Descriptive 
Statistics=>Explore. .. (Analisar=>Estatfstica 
Descritiva=>Explorar...) para abrir a caixa de 
dialogo como a da Figura 3.17. Para manter as 
coisas de forma simples, olharemos apenas os 
escores do exame do SPSS e o de numeracia 
desse arquivo, portanto, transfira essas duas va- 
riaveis da lista a esquerda do quadro denomina- 
do Dependent List (Lista Dependente) clicando 
em jJ proximo ao quadro e, ja que queremos 
dividir a saida agrupando os dados para com¬ 
parer as variancias, selecione a variavel uni e 
a transfira para o quadro denominado Factor 
List (Lista de Fatores) clicando em _J. Depois 
clique em PW * para abrir uma nova caixa de 
dialogo como na Figura 3.17. Para realizar o 
teste de Levene, precisamos selecionar uma 
das opgoes em que diz Spread vs. Level with 
Levene’s test (Dispersao versus Nivel com o 
Teste de Levene). Se voce selecionar unnan-.iom.fd ; 
o teste de Levene e realizado com os dados bru- 
tos (um bom comego). No entanto, se as varian¬ 
cias forern diferentes, voce pode corrigir a de- 
sigualdade utilizando uma das transformagoes 
que ja foram vistas neste capltulo. Utilizando a 
mesma caixa de dialogo, se selecionarmos ago¬ 
ra a Transformed > V oce ira notar que um menu tipo 
lista suspensa ficara ativo (veja a Figura 3.17) e, 
se for selecionada uma dessas transformagoes 
listadas e rodar a analise, o SPSS ira calcular o 
que seria o teste de Levene se os dados fossem 
transformados utilizando esse metodo. Isso po- 
dera lhe poupar bastante tempo que seria gasto 


tentando varias transformagoes. Comece reali- 
zando a analise com G Ufwansbm,«f selecionado e 
entao volte para realiza-la com a Transformed sele¬ 
cionada (tente uma transformagao logarftmica 
[log] para comegar). Quando terminal' com essa 
caixa de dialogo, clique em c *«~» para retornar a 
caixa de dialogo principal do explore (explorer) 
e clique em °* para rodar a analise. 

A saida 3.5 do SPSS mostra a tabela do 
teste de Levene primeiro quando a analise foi 
feita com a opgao p uniformed selecionada e 
depois com a opgao Transformed selecionada (lo- 
garitmo natural). Voce deve ler as estatisticas 
baseadas na media. Para os dados nao transfor¬ 
mados, parece que o teste de Levene e nao-sig- 
nificativo para os escores do exame do SPSS 
(valores na coluna rotulada como Sig. [Signifi- 
cancia](sao maiores do que 0,05) indicando va¬ 
riancias nao significativamente diferentes (isto 
e, elas sao similares e a suposigao de variancias 
homogeneas e mantida). No entanto, para os 
escores da numeracia, o teste de Levene e sig- 
nificativo (valores na coluna denominada Sig. 
[Significancia] sao menores do que 0,05) indi¬ 
cando que as variancias sao significativamente 
diferentes (isto e, elas nao sao as mesmas e a 
hipotese de homogeneidade das variancias foi 
violada). Assim, isso podera nos fornecer um 
motivo para transformar os escores de nume¬ 
racia. Vamos ver o que ocorre quando fazemos 
isso. Bern, para os escores transformados loga- 
ritmicamente, o problema foi revertido: o teste 
de Levene e agora significativo para os escores 
do exame do SPSS (valores na coluna denomi¬ 
nada Sig sao menores do que 0,05), mas nao e 
mais significativo para os escores de numera- 



Figura 3.17 Explorando grupos de dados e obtendo o teste de Levene. 
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Saida 3.5 do SPSS 

Dados nao transformados 


Tests of Homogeneity of Variance (Teste de homogeneidade das variancias) 




Levene Statistic 
(Estatistica 
de Levene) 

dfl 

(gii) 

df2 

(g!2) 

Sig. 

(Sig.) 

Percentage on 

Based on Mean (Baseado na media) 

2.584 

1 

98 

0.111 

SPSS exam 

Based on Median (Baseado na medians) 

2.089 

1 

98 

0.152 

(Percentual 
no exame do 

Based on Median and with adjusted df 
(Baseado na mediana com gt ajustado) 

2.089 

1 

94.024 

0.152 

SPSS) 

Based on trimmed mean 
(Baseado na media interna) 

2.523 

1 

98 

0.115 

Numeracy 

Based on Mean (Baseado na media) 

7.368 

1 

98 

0.008 

(Numeracia) 

Based on Median (Baseado na mediana) 

5.366 

1 

98 

0.023 


Based on Median and with adjusted df 
(Baseado na mediana com gl ajustado) 

5.366 

1 

83.920 

0.023 


Based on trimmed mean 
(Baseado na media interna) 

6.766 

1 

98 

0.011 


Dados transformados logatimicamente 


Tests of Homogeneity of Variance (Teste de homogeneidade das variancias) 




Levene Statistic 
(Estatistica 
de Levene) 

dfl 

(gii) 

df2 

(g!2) 

Sig. 

(Sig.) 

Percentage on 

Based on Mean (Baseado na media) 

25.055 

1 

98 

0.000 

SPSS exam 

Based on Median (Baseado na mediana) 

24.960 

1 

98 

0.000 

(Percentual 
no exame do 

Based on Median and with adjusted df 
(Baseado na mediana com gt ajustado) 

24.960 

1 

64.454 

0.000 

SPSS) 

Based on trimmed mean 
(Baseado na media interna) 

25.284 

1 

98 

0.000 

Numeracy (Nu- 

Based on Mean (Baseado na media) 

0.211 

1 

98 

0.647 

meracia) 

Based on Median (Baseado na mediana) 

0.279 

1 

98 

0.598 


Based on Median and with adjusted df 
(Baseado na mediana com gl ajustado) 

0.279 

1 

97.664 

0.598 


Based on trimmed mean 
(Baseado na media interna) 

0.238 

1 

98 

0.627 


cia (valores na coluna denominada Sig nao sao 
menores do que 0,05). Nessa situaqao, consi- 
derando que estamos comparando as duas uni- 
versidades nos escores de numeracia e exame 
do SPSS separadamente, devemos transformar 
os escores da numeracia, mas nao os do exa¬ 
me. O teste de Levene podera ser representado 
pela letra F e apresenta dois diferentes graus 
de liberdade. Como tal, ele podera ser relatado, 
de forma geral, como / 7 (gl 1 ; gl 2 ) = valor, Sig. 
Assim, para o percentual obtido no exame do 
SPSS, podemos dizer que as variancias nao sao 


iguais, F(l, 98) = 2,58, ns, mas para os escores 
da numeracia as variancias sao significativa- 
mente diferentes, F(l, 98) = 7,37, p < 0,01. 
Tente relatar esses resultados para os escores 
logaritimicamente transformados. 

3.7 REPRESENTANDO MEDIAS 
GRAFICAMENTE ® 

Tendo realizado todas essas experiencias 
com os dados, voce pode querer representar al- 
gumas medias graficamente. Esta seqao mostra 
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como utilizar alguns dos procedimentos grafi- 
cos do SPSS para criar graficos de medias (isso 
e util quando voce fizer o relatorio ou quando 
for apresenta-lo a outras pessoas). Como voce 
ira criar esses graficos no SPSS depende em 
grande parte da forma que os dados foram co- 
letados (se foram utilizadas as mesmas pessoas 
ou pessoas diferentes para medir os diferentes 
nfveis de cada variavel). Para comecar, imagine 
que o diretor de uma companhia cinematogra- 
fica esta interessado em verificar se existe algo 
conhecido como “filme de garotas” (um filme 
que tipicamente interessa mais as mulheres do 
que aos homens). Ele pegou 20 homens e 20 
mulheres e mostrou a metade de cada amostra 
um filme supostamente “de garotas” ( O didrio 
de Bridget Jones) e para a outra metade um 
filme que nao se encaixaria nessa categoria 
(.Amnesia - um filme brilhante, por sinal). Em 
todos os casos ele mensurou a excitagao fisio- 
logica como uma medida de quanto o filme foi 
apreciado. Os dados estao no arquivo deno- 
minado ChickFlick.sav no site www.artmed. 
com.br. Carregue esse arquivo agora. 

Para tragar um 
diagrama das me¬ 
dias, iremos utilizar 
os graficos interati- 
vos do SPSS. A 
principal vantagem 
desses graficos e 
que e possfvel colo- 
car barras de erros 
(veja o Capftulo 8) 
e eles podem ser atualizados mesmo quando a 
base de dados estiver fechada (veja o Quadro 
3.4). Voce pode tambem tragar graficos utilizan- 
do o procedimento nao interativo do SPSS, mas, 
para salvar arvores, escrevi isso em um arquivo 
que esta no site www.artmed.com.br 
(Answers(Chapter 3).pdf) e no Capftulo 4. Va- 
mos dar uma olhada em um tragado simples: 
primeiro clique em Graphs=>Interacti¬ 
ve^ Bar... (Graficos=>Interativos=t>Barras...) 
para ativar a caixa de dialogo como a da Figura 
3.18. Note que existe uma representagao esque- 
matica dos eixos horizontais e verticals e que 
ambos apresentam um espago onde e possfvel 
arrastar uma variavel da lista a esquerda. O eixo 




y precisa ser a variavel dependente ou o que 
voce mensurou, ou simplesmente a coisa para a 
qual voce quer apresentar a media. Nesse caso, 
sera a arousal (excitagao), assim, selecione-a 
da lista e arraste-a para o espago que aparece no 
eixo vertical. O eixo x deve ser a variavel na 
qual queremos dividir os dados da excitagao. 
Para simplificar, vamos apenas tragar as medias 
para os dois filmes. Selecione a variavel film 
(filme) da lista a esquerda e arraste-a para o es¬ 
pago existente no eixo horizontal. 8 Na caixa de 
dialogo embaixo existe uma segao denominada 
Bars Represent. .. (Barras representam) e ela fi- 
cara ativa somente depois que voce especificar a 
variavel do eixo vertical (ela e intitulada Bars 
Represent Arousal (Barras representam excita¬ 
gao) porque especificamos a excitagao para o 
eixo vertical). Por padrao, as barras irao repre- 
sentar as medias (geralmente o que deseja- 
mos), mas voce pode selecionar a partir da 
lista suspensa clicando em zi qualquer outra 
medida descritiva desde as 
de tendencia central (como 
a mediana e a moda), me- 
didas de dispersao (varian- 
cia e desvio padrao) e me- 
didas como a assimetria e 
a curtose. 

Se quisermos adicionar as barras de er¬ 
ros (veja a Segao 7.3), devemos clicar na guia 
(orelha) Error Bars (Barras de Erros) no topo 
da caixa de dialogo e selecionar Por 

omissao, o SPSS ira mostrar um intervalo de 
confianga para a media (veja a Segao 1.6.2), mas 
se voce escolher pela lista suspensa clicando em 
Ll proximo de onde diz Units (Unidades), pode- 
ra escolher tragar o desvio padrao (veja a Segao 
1.4.1) ou o erro padrao da media (veja a Segao 
1.6). Finalmente, por padrao, voce pode esco¬ 
lher uma representagao diferente selecionando 
um dos quatros botoes que estao embaixo. Pre- 
firo o ultimo que apresenta as linhas apontando 
para fora do topo de cada - 
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Means 
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Standard Deviations 
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barra, assim, 
seleciono esse. 


eralmente 


ISUndaid DmMM 

| Standard Ewrf M*an 


Para este trabalho e importante que voce tenha especi- 
ficado a variavel como nominal (veja a Segao 2.4.3) 
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Figura 3.18 Caixas de dialogo para digramas de barras interativo com barras de erros. 


A Figura 3.19 mostra o diagrama de bar¬ 
ras resultante. Ele simplesmente apresenta as 
medias (e o intervalo de confianga dessas me- 
dias). Esse grafico demonstra que, em media, 
as pessoas ficaram mais excitadas pelo filme 
Amnesia do que por O Didrio de Bridget Jo¬ 
nes. Entretanto, inicialmente querfamos veri- 
ficar os efeitos do genero, dessa forma, esse 
grafico nao esta informando o que precisamos 


saber. O grafico que precisamos e o agrupado 
(clustered graph ) e ele e facilmente criado uti- 
lizando a mesma caixa de dialogo usada antes 
(veja a Figura 3.18), mas agora especificando 
uma segunda variavel (nesse caso, genero) no 
quadra que diz Legend Variable (Variavel de 
Legenda) proximo de onde diz Color (Cores). 
Arraste a variavel gender (genero) para esse 
espaco. A caixa de dialogo final e mostrada na 


25,00 

20,00 

o 

5 15,00 
S3 

UJ 

10,00 
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O Diario de Bridget Jones Amnesia 

Filme 

Figura 3.19 Diagrama de barras para a excitagao media para cada um dos dois filmes. 
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Figura 3.20 e o diagrama de barras resultante, 
na Figura 3.21. Esse grafico e mais informati¬ 
ve). Ele mostra o mesmo que o ultimo grafico: 
isto e, que a excita^ao foi mais alta para Am¬ 
nesia do que para O Diario de Bridget Jones, 


mas ele tambem divide isso por genero. Olhe 
primeiro para a excitagao media de O Diario 
de Bridget Jones', ele mostra que os homens 
ficaram de fato mais excitados do que as mu- 
lheres. Isso indica que eles gostaram mais do 



Figura 3.20 Caixa de dialogo completa para diagrama de barras agrupado. 


Genero 
D Masculino 
□ Feminino 


As barras de erros mostram um 1C 
de 95% para a media. 

As barras mostram medias 


0 Diario de Bridget Jones Amnesia 

Filme 

Figura 3.21 Grafico agrupado mostrando a excitagao de homens e mulheres medida durante os 
dois filmes. 
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Quadro 3.4 


Transformando graficos interativos em interativos! © 

A principal vantagem de utilizar urn grafico interativo no SPSS (em vez de um nao-interativo) 
e que voce pode atualiza-lo mesmo quando o arquivo de dados estiver fechado. No entanto, para 
que isso acontega, voce precisa marcar essa capacidade interativa que esta desligada. Utilize o 
menu Edit=>Options... (Editar=>Opgoes...) para ter acesso a caixa de dialogo options (opgoes). 
Dentro dessa caixa de dialogo existe uma guia (orelha)no topo denominada Interactive (Interati¬ 
vo), assim, clique nessa orelha e selecione a opgao Save data with the chart (Salve os dados com 
o grafico). Isso transformara seu grafico interativo em, de fato, interativo! Se voce estiver utilizan- 
do uma grande base de dados talvez ache melhor desligar novamente essa opgao e atualizar o 
grafico manualmente se os dados forem alterados ou atualizados. 



filme que as mulheres! Contraste isso com o 
filme Amnesia, no qual a excitagao entre ho- 
mens e mulheres e semelhante. Em face disso, 
a ideia do “filme de garotas” nao procede: de 
fato, parece que homens gostam mais de fil- 
mes do tipo “de garotas” do que as proprias 
garotas (provavelmente por que e a unica aju- 
da que temos para entender o complexo fun- 
cionamento da mente feminina!). 

Voce pode editar quase todos os aspectos 
de um grafico clicando duas vezes no grafico 
e entao clicando na caracterfstica que deseja 
alterar. Voce pode trocar as cores das barras, 
os titulos dos eixos, a escala de cada eixo e as¬ 
sim por diante. Pode, tambem, tornar as barras 
tridimensicionais. Contudo, por mais tentador 
que isso possa ser (ele pode parecer muito bo- 
nito) tente resistir a ten tag ao de construir gra¬ 
ficos 3-D (a menos que voce esteja realmente 


representando tres variaveis): a dimensao ex¬ 
tra nao informa de util e normalmente torna 
apenas o grafico mais diffcil de interpretar 
(veja Wright 2003). 

3.8 0 QUE DESCOBRIMOS SOBRE 
ESTATISTICA? © 

Este capitulo abordou muitas coisas rapi- 
damente! Tentei lhe mostrar a importancia de 
examinar os dados de forma apropriada antes 
de comegar a analise estatistica. Primeiro, ve- 
rificamos a distribuigao dos dados e tentamos 
descobrir possiveis erros que tenham sido 
cometidos na entrada ou digitagao dos dados 
e tambem procuramos valores atipicos ( ou¬ 
tliers ). Para distribuigoes nao-normais, vimos 
como transformar os dados a fim de corrigir 
o problema e como tratar os valores atipicos. 
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Se voce estiver trabalhando com dados que 

comparam diferentes grupos, deve exami- 

liar as distribuigoes dentro dos grupos. Voce 
pode tambem aplicar testes estatfsticos para 
verificar a normalidade dos dados (o teste de 
Kolmogorov-Smirnov) e olhar para outros 
graficos como o diagrama Q-Q. Tambem des- 
cobrimos alguns usos para a fungao transform 
(transformar) do SPSS e para o comando split 
file (dividir arquivo). Finalmente, analisamos 
rapidamente como tragar medias utilizando 
graficos interativos. 

3.9 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• Bimodal 

• Dados normalmente distribufdos 

• Diagramas de caixa e bigodes 

• Homogeneidade da variancia 

• Independence 

• Intervalo interquartflico 

• Mediana 

• Multimodal 

• Razao de variances 

• Teste de Kolmogorov-Smirnov 

• Teste de Levene 

• Teste de Shapiro-Wilk 

• Teste parametrico 

• Transformagao 

• Valor atfpico 


3.10 TAREFAS DO ALEX ESPERTO 



Utilizando os dados do Capi- 
tulo 2 (que voce deve ter salvo, 
mas se nao o fez, copie-os no- 
vamente da Tabela 2.1), fag a 
alguns graficos do numero me¬ 
dio de amigos, consumo de alcool, renda 
e neurose dos estudantes e dos professo- 
res. Quem tern mais amigos, bebe mais, 
ganha mais e e mais neurotico? © 
Utilizando o arquivo ChicFlick.sav, veri- 
fique se as distribuigoes para os dois fil- 
mes (ignore o genero) sao normalmente 
distribufdas. © 

Utilizando os dados do arquivo SPSSE- 
xam.sav (lembre que os escores da nume- 
racia pareciam ter assimetria positiva - veja 
a Figura 3.10), transforme esses dados utili¬ 
zando uma das transformagoes descritas no 
Capltulo; os dados se tornaram normals? 


Algumas respostas breves podem ser 
encontradas no arquivo Answers(Chapter 
3).pdf no site www.artmed.com.br. 


3.11 LEITURAS COMPLEMENTARES 

TABACHNICK, B. G., FIDELL, L. S. Using 
multivariate statistics. Boston: Allyn & Bacon, 
2001 (4“ ed.). O Capltulo 4 e o guia definitivo 
para a analise de dados! 

WRIGHT, D. B. First steps in statistics. London: 
Sage, 2002. O Capltulo 2 e uma boa introdugao 
a construgao de graficos. 


IC = Intervalo de confianga 









CORRELAQAO 


4.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 


0 que e 
" rrelagao? 


Geralmente, e interes- 
sante para pesquisadores 
saber qual e o relaciona- 
mento que existe, se existe 
algum, entre duas ou mais 
variaveis. Uma correla§ao 
e uma medida do relacio- 
namento linear entre varia- 
. Por exemplo, posso estar interessado no 



veis 

relacionamento entre o tempo gasto lendo este 
livro e o entendimento do leitor sobre estatfstica 
e SPSS. Essas duas variaveis podem estar rela- 
cionadas de varias maneiras: (1) elas podem es¬ 
tar positivamente relacionadas, o que significa 
que quanto mais tempo a pessoa gasta lendo 
este livro, maior o seu entendimento sobre esta¬ 
tfstica e SPSS; (2) elas podem nao estar relacio¬ 
nadas de forma alguma, o que significa que o 
entendimento da pessoa sobre estatfstica e SPSS 
permanece o mesmo independentemente do 
tempo que ela gasta lendo este livro; ou (3) elas 
podem estar negativamente relacionadas, o que 
significa que quanto mais uma pessoa ler este 
livro, menor o seu entendimento sobre estatfsti¬ 
ca e SPSS. Como podemos verificar se duas va¬ 
riaveis estao relacionadas? Este capftulo trata, 


em primeiro lugar, de como podemos expressar 
estatisticamente os relacionamentos entre varia¬ 
veis utilizando duas medidas: a covariancia e o 
coeficiente de correlagdo. Depois, veremos 
como e possfvel representar graficamente os re¬ 
lacionamentos, antes de descobrir como investi- 
gar e interpretar correlagoes com o SPSS. O ca¬ 
pftulo termina avaliando medidas mais 
complexas de relacionamento e, desse modo, 
introduz o capftulo sobre regressao multipla. 


4.2 COMOMEDIMOS 

RELACIONAMENTOS? © 

4.2.1 Um desvio para o mundo da 
covariancia © 

A maneira mais simples de verificar se duas 
variaveis estao associadas e ver se elas variam 
conjuntamente. Para entender o que covarian¬ 
cia significa precisamos lembrar o conceito de 
variancia que encontramos no Capftulo 1. Lem- 
bre que a variancia de uma variavel representa 
a media que os dados se afastam da media. Em 
numeros, ela e descrita pela equa$ao (4.1): 


Variancia = s 2 

= XX 

N -1 


X (*,■-*)(*,■ -x) 


(4.1) 


N -1 
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A media da amostra e representada por 
x, o dado em questao e representado por x t , 
e N e o numero de observagoes (veja a Segao 
1.4.1). Se estivermos interessados em verifi- 
car se duas variaveis estao relacionadas, pre- 
cisamos ver se as mudangas em uma variavel 
correspondem a mudangas similares na outra 
variavel. Portanto, quando uma variavel 
se desvia da sua media, esperamos que a 
outra variavel se desvie da sua media de 
maneira similar. Para ilustrar o que quero di- 
zer, imagine que pegamos cinco pessoas e as 
submetemos a certo numero de propagandas 
promovendo as balas toffee e, entao, medi- 
mos quantos pacotes dessas balas cada pessoa 
comprou durante a semana seguinte. Os dados 
sao apresentados na Tabela 4.1, assim como a 
media e o desvio padrao (sj de cada variavel. 

Se existe um relacionamento entre essas 
duas variaveis, entao enquanto uma variavel 
se desvia da sua media, a outra variavel deve- 
ria se desviar da sua media da mesma maneira 
ou de maneira diretamente oposta. A Figura 
4.1 mostra os dados para cada participante (os 
quadrados representam o numero de pacotes 
comprados e os cfrculos representam o numero 
de propagandas assistidas); a linha pontilhada 
e o numero medio de pacotes comprados e a 
linha cheia e o numero medio de propagandas 
assistidas. As linhas verticals representam as 
diferengas entre os valores observados e a me¬ 
dia da variavel de interesse. A primeira coisa 
a ser observada na Figura 4.1 e que existe um 
padrao muito similar nas diferengas de am- 
bas as variaveis. Para os tres primeiros parti¬ 
cipates, os valores observados estao abaixo 
da media para ambas variaveis e para as duas 
ultimas pessoas, os valores observados estao 
acima da media para ambas variaveis. Esse 
padrao e indicativo de um relacionamento 
potencial entre duas variaveis (porque parece 
que se o escore de uma pessoa esta abaixo da 


media para uma variavel, entao o escore para a 
outra estara, tambem, abaixo da media). 

Assim, como calculamos a semelhanga 
exata entre o padrao das difcrencas das duas 
variaveis mostradas na Figura 4.1? Uma pos- 
sibilidade e calcular a quantidade total de dife¬ 
rengas, mas terfamos o mesmo problema que 
no caso da variavel unica (veja a Segao 1.4.1). 
Igualmente, adicionando simplesmente as di¬ 
ferengas, terfamos uma pequena percepgao 
do relacionamento entre variaveis. Agora, no 
caso da variavel unica, elevamos ao quadrado 
as diferengas para eliminar o problema de di- 
ferengas positivas e negativas cancelarem uma 
a outra. Quando ha duas variaveis, em vez de 
elevar ao quadrado cada diferenga, podemos 
multiplicar a diferenga de uma variavel pela 
diferenga correspondente da segunda variavel. 
Se ambos os erros sao positivos ou negativos, 
isso nos dara um valor positivo (indicando 
erros na mesma diregao), mas se um erro for 
positivo e outro negativo, o produto resultan- 
te sera negativo (indicando erros em diregoes 
opostas). Quando multiplicamos as diferengas 
de uma variavel por diferengas corresponden- 
tes da segunda variavel, conseguimos o que 
chamamos de desvios dos produtos cruzados. 
Com a variancia, se queremos um valor medio 
das diferengas combinadas para as duas varia¬ 
veis, devemos dividir pelo numero das obser- 
vagdes (dividimos, de fato, por N — 1). Essa 
media das diferengas combinadas e conhecida 
como covaridncia. Podemos escrever a cova- 
riancia na forma de equagao como em (4.2) 
- voce podera notar que a equagao e igual a 
da variancia, exceto que em vez de elevar ao 
quadrado as diferengas da mesma variavel, 
multiplicamos as diferengas correspondentes 
de cada variavel: 


cov(x, j) = 


^(x,-x)Q,-y) 
N -1 


(4.2) 


Tabela 4.1 


Sujeito 

1 

2 

3 

4 

5 

Media 

S 

Comerciais Assistidos 

5 

4 

4 

6 

8 

5,4 

1,67 

Pacotes Comprados 

8 

9 

10 

13 

15 

11,0 

2,92 
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Figura 4.1 Grafico mostrando as diferengas entre os dados observados e as medias de duas 
variaveis. 


Para os dados da Tabela 4.1 e da Figura 
4.1, temos o seguinte valor: 


cov(.r, y) 


N-l 

(-0,4)(-3) + (-F4X-2) 
4 


+(—1'4)(—1) + (—0,6)(2)+(2,6)+(4) 
4 

_ 1,2+2,8 + 1,4 + 1,2 + 10,4 
4 

_ 17 
= 4,25 


Calcular a covariancia e uma boa maneira 
de avaliar se duas variaveis estao relacionadas 
entre si. Uma covariancia positiva indica que 


quando uma variavel se desvia da media, a ou- 
tra variavel se desvia na mesma diregao. Por ou- 
tro lado, uma covariancia negativa indica que, 
enquanto uma variavel se desvia da media (por 
exemplo, aumenta), a outra se desvia da media 
na diregao oposta (por exemplo, diminui). 

Existe, entretanto, um problema com a co¬ 
variancia como uma medida do relacionamento 
entre variaveis: ela depende das escalas utiliza- 
das para a medida. Assim, covariancia nao e uma 
medida padronizada. Por exemplo, se usarmos 
os dados acima e assumirmos que eles represen- 
tam duas variaveis mensuradas em quilometros, 
entao a covariancia e de 4,25 (calculada acima). 
Se convertermos esses dados em milhas (multi- 
plicando todos os valores por 1,609) e calcular- 
mos a covariancia novamente, devemos desco- 
brir que ela aumenta para 11. Essa dependencia 
da escala de medidas e um problema porque sig- 
nifica que nao podemos comparar a covariancia 

















128 Andy Field 


de uma maneira objetiva - assim, nao podemos 
dizer se a covariancia e particularmente grande 
ou pequena em rela^ao a outro conjunto de da¬ 
dos a nao ser que ambos os conjuntos fossem 
mensurados nas mesmas unidades. 

4.2.2 Padronizagao e o coeficiente de 
correlagao © 

Para superar o problema da dependencia 
da escala de mensuracao. precisamos conver¬ 
ter a covariancia em um conjunto padrao de 
unidades. Esse processo e conhecido como 
padronizagao . Uma forma basica de padro- 
nizagao seria insistir que em todos os experi- 
mentos fossem utilizadas as mesmas unidades 
de mensuracao, digamos, metros - dessa ma¬ 
neira, todos os resultados poderiam ser facil- 
mente comparados. Entretanto, se voce fosse 
medir atitudes, por exemplo, seria muito di- 
ffcil faze-lo em metros! Portanto, precisamos 
de uma unidade de medida na qual qualquer 
escala de mensuracao possa ser convertida. 
A unidade de medida que usamos e o desvio 
padrao. Falamos sobre essa medida na Se- 
Cao 1.4.1 e vimos que, como a variancia, ela 
e uma medida da media dos desvios a partir 
da media. Se dividirmos qualquer distancia a 
partir da media pelo desvio padrao, isso nos 
dara essa distancia em unidades de desvios 
padrao. Por exemplo, para os dados na Tabela 
4.1, o desvio padrao para o numero de paco- 
tes comprados e aproximadamente 3,0 (o va¬ 
lor exato e 2,91). Na Figura 4.1, podemos ver 
que os valores observados para o participante 
1 foram tres pacotes a menos do que a media 
(assim, houve um erro de — 3 pacotes de ba- 
las). Se dividirmos essa diferenca, —3, pelo 
desvio padrao, aproximadamente 3, teremos 
um valor de — 1. Isso nos mostra que a dife¬ 
renca entre o escore do participante lea me¬ 
dia foi de — 1 desvio padrao. Assim, podemos 
expressar o desvio a partir da media para um 
participante em unidades padronizadas divi- 
dindo o desvio observado pelo desvio padrao. 

Seguindo essa logica, se quisermos expres¬ 
sar a covariancia numa unidade padrao de me¬ 
dida, podemos simplesmente dividi-la pelo des¬ 
vio padrao. Entretanto, existem duas variaveis 


e, dessa maneira, dois desvios padrao. Quando 
calculamos a covariancia, na verdade calcula- 
mos dois desvios (um para cada variavel) e, en- 
tao, os multiplicamos. Por conseguinte, fazemos 
o mesmo com os desvios padrao: nos os multi¬ 
plicamos e dividimos pelo produto dessa multi- 
plicacao. A covariancia padronizada e conheci- 
da como coeficiente de correlagao. E e definida 
pela equacao (4.3) na qual s x e o desvio padrao 
da primeira variavel ejjeo desvio padrao da 
segunda variavel (todas as outras letras sao as 
mesmas da equacao definindo a covariancia): 

r = cov Cuy) = ~ *Xy- - y) (43 ^ 

S x Sy (N — \)S x Sy 

O coeficiente na equacao (4.3) e conhe¬ 
cido como o coeficiente de correlagao pro- 
duto-momento de Pearson (ou simplesmen¬ 
te coeficiente de correlacao de Pearson) e 
foi inventado por Pearson (que surpresa!). 1 
Se olharmos para a Tabela 4.1, vemos que o 
desvio padrao para o numero de propagandas 
assistidas (s x ) foi 1,67 e para o numero de pa¬ 
cotes de balas compradas (s v ) foi 2,92. Se mul- 
tiplicarmos esses valores, temos 1,67X2,92 = 
4,88. Agora, tudo o que precisamos fazer e 
pegar a covariancia, que calculamos algumas 
paginas atras como sendo 4,25, e dividir por 
esse produto. Isso nos da r = 4,25/4,88 = 0,87 
(esse e o mesmo valor que voce encontrara 
mais tarde na Saida 4.1 do SPSS). 

Padronizando a covariancia, encontramos 
um valor que deve estar entre — 1 e +1 (se voce 
encontrar um coeficiente de correlacao menor 
de que — 1 ou maior do que +1, pode estar certo 
que alguma coisa saiu errada!) Um coeficiente 
de +1 indica que as duas variaveis sao perfei- 
tamente correlacionadas de forma positiva, as¬ 
sim, enquanto uma variavel aumenta, a outra 


1 Voce ira encontrar o coeficiente de correlacao momen- 
to-produto de Pearson representado por ambos r e R. 
Tipicamente, a letra maiuscula e usada num contexto 
de regressao porque ela representa o coeficiente de cor- 
rela 5 ao multiplo; entretanto por alguma razao, quan¬ 
do elevamos r ao quadrado (como na Se 9 ao 4.5.3), e 
utilizado o R com letra maiuscula. Nao me pergunte o 
porque - e so para me confundir, eu acho. 
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• Uma medida grosseira do relacionamento entre variaveis e a covariancia. 

• Se padronizarmos esse valor temos o coeficiente de correlagao de Pearson, r. 

• 0 coeficiente de correlagao deve variar entre-1 e+1. 

• Um coeficiente de +1 indica urn relacionamento positivo perfeito, um coefi¬ 
ciente de -1 indica um relacionamento negativo perfeito, um coeficiente 0 
indica que nao existe relacionamento linear. 

• 0 coeficiente de correlagao e uma medida do tamanho de um efeito comu- 
mente utilizada: valores de ± 0,1 representam um efeito pequeno, ± 0,3 re- 
presenta um efeito medio e ± 0,5, um efeito grande. 

___ J 


aumenta proporcionalmente. Inversamente, um 
coeficiente de — 1 indica um relacionamento 
negativo perfeito: se uma variavel aumenta, a 
outra diminui por um valor proporcional. Um 
coeficiente 0 indica ausencia de relacionamen¬ 
to linear, isto e, se uma variavel muda, a outra 
permanece praticamente igual. Tambem vimos 
na Segao 1.8.4 que, como o coeficiente de cor¬ 
relagao e uma medida padronizada de um efei¬ 
to observado, ele e uma medida comumente 
usada do tamanho de efeito, e que valores de ± 
0,1 representam um efeito pequeno, ± 0,3, um 
efeito medio e ± 0,5, um efeito grande. 

4.3 ENTRADA DE DADOS PARA 
REALIZAR UMA ANALISE DE 
C0RRELACA0 NO SPSS © 

A entrada de dados para a correlagao, a re- 
gressao e a regressao multipla e simples porque 
cada variavel e introduzida em uma coluna se- 
parada. Portanto, para cada variavel que voce 
mediu, crie uma variavel no editor de dados com 
um nome apropriado, e digite os escores de um 
participante numa linha do editor de dados. Po- 
dera ocorrer que voce tenha uma ou mais varia¬ 
veis categoricas (como o genera) e essas varia¬ 
veis tambem podem ser digitadas numa coluna 
(mas lembre-se de deftnir o valor apropriado dos 
rotulos). Por exemplo, se quisessemos calcular a 
correlagao entre as duas variaveis na Tabela 4.1, 
deverfamos entrar esses dados como na Figura 
4.2. Ao longo deste capitulo iremos analisar um 
conjunto de dados baseado no desempenho em 
uma prova da faculdade. Os dados para varios 


exemplos estao armazenados num tinico arqui- 
vo disponivel no site www.artmed.com.br cha- 
mado de ExamAnxiety.sav. Se voce abrir esse 
arquivo, vera que esses dados serao exibidos no 
editor em colunas separadas e que gender (ge¬ 
nero) foi codiftcado de forma correta. Iremos 
descobrir a que cada uma das variaveis se refere 
neste capitulo. 

4.4 REPRESENTANDO 
RELACI0NAMENT0S 
GRAFICAMENTE: 

0 DIAGRAMA DE DISPERSAO © 

Antes de conduzir qualquer analise de 
correlagao e essencial tragar um diagrama de 
dispersao para ver a tendencia geral dos dados. 
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Figura 4.2 Entrada de dados para a correlagao. 
0 editor de dados mostra que o participante um 
viu cinco propagandas (adverts) e subsequente- 
mente comprou oito pacotes (packets) de balas. 
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Um diagrama de dis¬ 
persao e simplesmente 
um grafico que coloca 
o escore de cada pessoa 
em uma variavel contra 
seu escore em outra (e 
seu escore numa ter- 
ceira variavel pode ser 
inclufdo em um diagra¬ 
ma de dispersao 3D). Um diagrama de disper¬ 
sao nos diz muitas coisas sobre os dados, por 
exemplo, se parece haver um relacionamento 
entre as variaveis, que tipo de relacionamen¬ 
to ele e e se quaisquer casos sao significati- 
vamente diferentes dos outros. Um caso que 
difere substancialmente da tendencia geral 
dos dados e conhecido como um valor atipi- 
co e tais casos podem distorcer severamente o 
coeficiente de correlagao (veja o Quadro 3.1 e 
a Segao 5.6.1.1 para mais detalhes). Podemos 
usar um diagrama de dispersao para mostrar 
se algum caso parece um valor atipico. 

Tragar um diagrama de dispersao usando o 
SPSS e facil demais. Voce pode traga-lo usan¬ 
do o menu dos graficos interativos ou usando 
graficos nao-interativos. Vamos examinar os 
dois tipos de graficos porque ha diagramas 
de dispersao que voce pode criar apenas com 
graficos nao-interativos. 


4.4.1 Diagrama de dispersao simples 0 

Esse tipo de diagrama de dispersao serve 
para relacionar apenas duas variaveis. Por 
exemplo, uma psicologa estava interessada 
nos efeitos do estresse pre-prova no desempe- 
nho na prova. Assim, ela planejou e validou 
um questionario para estimar o estado de an- 
siedade relacionado as provas (chamado de 
Questionario de Ansiedade Pre-Prova, ou 
QAP). Esse instrumento produziu uma medi- 
da de ansiedade numa escala de 1 a 100. A 
ansiedade foi medida antes de uma prova e a 
percentagem obtida para cada aluno foi usada 
para avaliar o desempenho na prova. Antes de 
verificar se essas variaveis estavam correla- 
cionadas, a psicologa fez um diagrama de dis¬ 
persao das variaveis envolvidas (os dados es- 
tao no arquivo ExamAnxiety.sav que voce ja 


deve ter aberto no SPSS). Para representar 
graficamente essas duas variaveis, voce pode 
usar um grafico interativo. Para tanto, selecio- 
ne Graphs=>Interactive=>Scatterplot... 
(Graficos=>Interativo=>Diagrama de Disper¬ 
sao...) para abrir uma caixa de dialogo como 
a da Figura 4.3. Nessa caixa de dialogo, todas 
as variaveis do editor de dados sao mostradas 
no lado esquerdo com espagos vazios no lado 
direito. Voce simplesmente clica numa varia¬ 
vel da lista a esquerda e a arrasta para o local 
apropriado. Em qualquer grafico o eixo verti¬ 
cal e conhecido como o eixo y (ou ordenada) 
do grafico. Essa variavel deve ser a dependen- 
te (o resultado que foi medido) 2 ,que nesse 
caso e exam performance (%) [exam] (de¬ 
sempenho da prova (%) [prova]). O eixo hori¬ 
zontal e conhecido como o eixo x (ou abscis¬ 
sa) do grafico. Essa variavel deveria ser a 
variavel independente, que e o caso em exam 
anxiety [anxiety] (ansiedade pre-prova [an¬ 
siedade]). A caixa de dialogo da Figura 4.3 
tern uma representagao esquematica do eixo y 
(a seta apontando 
para cima) e do eixo 
x (a seta apontando 
para a direita) e 
cada uma tern um espago. Para especificar es¬ 
sas variaveis, precisamos arrasta-las para o 
espago apropriado. Assim, arraste exam per¬ 
formance (%) [exam] (desempenho na prova 
(%) [prova]) para o espago do eixo y e arraste 
exam anxiety [anxiety] (ansiedade pre-prova 
[ansiedade]) para o espago do eixo x. 

Mais abaixo na caixa de dialogo existem 
outros espagos nos quais voce pode arrastar 
as variaveis. Voce pode usar uma variavel de 
grupo para definir diferentes categorias no 
diagrama de dispersao (ele ira exibir cada 



2 Na pesquisa experimental, e comum representar a 
variavel independente no eixo horizontal e a variavel 
dependente no eixo vertical. Nessa forma de pesquisa 
controlada, a implicagao e que mudangas na variavel 
independente (a variavel que o pesquisador manipulou) 
causam mudangas na variavel dependente. Na pesquisa 
correlacional, variaveis sao mensuradas simultanea- 
mente e, assim, nenhum relacionamento de causa e 
efeito pode ser estabelecido. Como tal, esses termos 
nao devem ser encarados de forma rigida! 
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Figura 4.3 Caixa de dialogo para um diagra- 
ma de dispersao simples. 


categoria usando uma cor diferente, sfmbolo 
ou grafico). Essa fungao e util para ver o rela- 
cionamento entre duas variaveis para grupos 
de pessoas. No exemplo atual, temos dados 
identificando se o estudante e do sexo mascu- 
lino ou feminino, assim, podemos usar essas 
cpgoes da seguinte maneira: 

• Color (Cor): Se voce selecionar Gen¬ 
der [gender] (Genero [genero]) da lista 
e arrasta-lo para esse espago, o diagrama 
de dispersao resultante exibira os dados 
masculinos numa cor diferente dos dados 
femininos. 

• Style (Estilo): Se voce selecionar Gen¬ 
der [gender] (Genero [genero]) da lista 
e arrasta-lo para esse espago, o diagrama 
de dispersao resultante usara sfmbolos 
diferentes para os dados masculinos e fe¬ 
mininos. Isso e o que escolhemos fazer e 
a caixa de dialogo resultante devera ser 
parecida com a da Figura 4.3. 

• Size (Tamanho): Se voce selecionar Gen¬ 
der [gender] (Genero [genero]) da lista 
e arrasta-lo para esse espago, os sfmbolos 
dos dados para o sexo masculino e femi¬ 
nino ficarao de tamanhos diferentes no 
diagrama de dispersao resultante. 


• Panel Variables (Variaveis do Painel): 
Se voce selecionar Gender [gender] 
(Genero [genero]) da lista e arrasta-lo 
para esse espago, o SPSS ira produzir 
dois diagramas de dispersao (lado a lado) 
- um para o sexo masculino e outro para 
o feminino. 

• Label Cases by (Rotular Casos por): Se 
voce selecionar Gender [gender] (Genero 
[genero]) da lista e arrasta-lo para esse es¬ 
pago, o SPSS colocara um rotulo proximo 
a cada ponto de dados no diagrama de dis¬ 
persao indicando se aqueles dados sao do 
sexo masculino ou feminino. Com muitos 
pontos de dados isso ira dificultar a leitura! 
Um dos usos pode ser se voce tiver uma 
variavel com o nome de um participante, 
ou um codigo; nesse casso, cada ponto no 
diagrama de dispersao sera rotulado com 
um codigo que identifica a pessoa, o que 
pode ser util para identificar valores atfpi- 
cos e, entao, ser realmente capaz de desco- 
brir qual caso e um valor atfpico! 


No topo da caixa de dialogo ha varias ore- 
lhas que dao acesso a outras opcoes. Se voce 
clicar em Titles (Tftulos), por exemplo, vera 
uma caixa de dialogo que da um espago para 
digitar um tftulo para o diagrama de dispersao. 
Uma orelha que pode ser util (especialmente 
quando 


Regresscn 



Regres»on 


Mean 


Smoother 



voce ler 
o proxi¬ 
mo capf- 

tulo) e a Fit (Ajustar) (Figura 4.4). Dentro des- 
sa caixa de dialogo voce pode escolher uma 
linha para tragar selecionando um Method 
(Metodo) da lista suspensa. Se voce escolher 
regression (regressao), o SPSS se ajustara a li¬ 
nha reta que melhor representa o relaciona- 
mento entre as variaveis no seu diagrama de 
dispersao (veja o Capftulo 5). Se voce escolher 
mean (media), o SPSS traga uma linha hori¬ 
zontal representando a media, e se voce esco¬ 
lher smoother (suavizar), uma linha curva que 
melhor descreva o relacionamento entre as va¬ 
riaveis no seu diagrama de dispersao sera ajus- 
tada. Se voce selecionar 17 Total, o SPSS tragara 
essas linhas para todos os dados, e se voce se- 
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Figura 4.4 Caixa de dialogo para ajustar uma linha de regressao. 


lecionar P Subgroups (subgrupos), ele tracara 
linhas diferentes para diferentes grupos especi- 
ficados por qualquer variavel de grupo que 
voce possa ter usado na caixa de dialogo do 
diagrama de dispersao original (as opcoes po- 
dem ser selecionadas ao mesmo tempo, assim, 
voce pode ter uma linha geral e linhas de sub¬ 
grupos no mesmo lote). No nosso exemplo, 
usamos genero como uma variavel de grupo; 
dessa forma, obtivemos uma linha para os ho- 
mens e outra para as mulheres. No momento, 
nao selecione nenhuma dessas opcoes, mas a 
medida que ler o Capftulo 5 tenha em mente 
que e assim que voce obtem uma linha de re¬ 
gressao num diagrama de dispersao! 

O diagrama de dispersao resultante e mos- 
trado na Figura 4.5. O diagrama de dispersao na 
sua tela sera um pouco diferente, pois os dados 
de homens e mulheres irao aparecer com sim- 
bolos distintos (triangulos e circulos). Substitui 
os marcadores de masculino e feminino para 
simbolos diferentes (isso me da a oportunidade 


de me exibir usando simbolos apropriados de 
genero!). O diagrama de dispersao mostra que 
a maioria dos estudantes sofre de niveis altos de 
ansiedade ha (poucos casos de ansiedade com 
niveis abaixo de 60). Tambem, nao existem 
valores atipicos obvios e a maioria dos pontos 
parece estar proximos uns dos outros. Parece, 
tambem, haver uma tendencia geral nos dados 
tal que niveis altos de ansiedade estao associa- 
dos a notas baixas nas provas e niveis baixos 
de ansiedade estao sempre associados a notas 
altas. Os marcadores de genero mostram que a 
ansiedade parece afetar homens e mulheres da 
mesma maneira (porque os diferentes simbo¬ 
los de homens e mulheres estao intercalados de 
maneira uniforme). Outra tendencia observada 
nesses dados e que nao houve casos de baixa 
ansiedade e baixo desempenho nas provas - de 
fato, a maioria dos dados esta agrupada na re- 
giao superior da escala de ansiedade. 

Se existissem quaisquer pontos de dados 
que obviamente nao se adequassem a tenden- 
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Figura 4.5 Diagrams de dispersao do desempenho na prova versus ansiedade pre-prova. 


cia geral dos dados, precisariamos descobrir se 
houve um bom motivo para que esses partici- 
pantes respondessem de modo tao diferente. 
Algumas vezes os valores atfpicos sao apenas 
erros na entrada de dados (isto e, voce digitou 
errado um valor), portanto, e bom checar nova- 
mente os dados na janela do editor para qual- 
quer caso que parent incomum. Se um valor 
atfpico nao pode ser explicado pela entrada in- 
correta de dados, e importante tentar descobrir 
se ha uma terceira variavel afetando o escore 
dessa pessoa. Por exemplo, uma pessoa pode 
estar sofrendo de ansiedade por algo diferente 
da prova e seu escore no questionario de an¬ 
siedade pode ter revelado essa ansiedade, mas 
pode ser a ansiedade especifica com a prova 
que interfere no desempenho. Portanto, a ansie¬ 
dade nao relacionada dessa pessoa nao afetou 
seu desempenho, mas resultou num escore alto 
de ansiedade. Se existe uma boa razao para um 


participante responder de modo diferente dos 
outros, voce pode considerar a eliminacao da- 
quele participante da analise a fim de construir 
um modelo preciso. Contudo, os dados dos 
participates nao devem ser eliminados porque 
eles nao se encaixam nas suas hipoteses - so- 
mente se existir uma boa explicacao para que 
tenham se portado de maneira tao estranha. 

4.4.2 Diagrama de dispersao 
tridimensional © 

Agora lhe mostrarei uma das poucas ve¬ 
zes em que e apropriado usar um diagrama 
3D! Um diagrama de dispersao em 3D e usa- 
do para mostrar o relacionamento entre tres 

variaveis. A razao pela qual esta correto usar 

um grafico em 3D aqui e porque a terceira di- 
mensao esta realmente nos dizendo algo de 

util (e ele nao esta la apenas para parecer 
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brilhante) 3 . Por exemplo, imagine que a sua 
pesquisadora decidiu que ansiedade pre-prova 
pode nao ser o unico fator contribuindo para o 
desempenho na prova. Entao, ela tambem pe- 
diu para os participantes manterem um diario 
de revisao, e ela calculou o 
mi mem de horas gastas revi- 
sando a materia da prova. A 
pesquisadora queria ver o re- 
lacionamento entre essas variaveis simulta- 
neamente. Para criar um diagrama de disper¬ 
sao em 3D, use uma caixa de dialogo como a 
da Figura 4.3. Nessa caixa de dialogo existe 
uma seta com um menu suspenso rotulado de 

2-D Co-ordinate (Coordenadas 2D). Clique 

na seta para acessar o menu suspenso e voce 

vera uma segunda opcao rotulada de 3-D Co¬ 

ordinate (Coordenadas 3D). Clique nessa op- 
?ao e uma representagao esquematica dos ei- 
xos ira mudar para incluir o terceiro eixo: o 
eixo z\ Usando a Figura 4.3 como um guia, 
complete a caixa de 
dialogo como ante- 
riormente (tente co- 
locar a variavel do 
genero na caixa colorida dessa vez), mas sele- 
cione 3-D Co-ordinate (Coordenada 3D) e en¬ 
tao clique e arraste a variavel Time spent re¬ 
vising [revise] (Tempo gasto revisando 
[revisao]) para o espa^o 
do eixo z. O diagrama de 
dispersao resultante e 
mostrado na Figura 4.6. 
Geralmente, os diagramas 
de dispersao em 3D po- 
dem ser dificeis de inter¬ 
pretar e, assim, sua utilidade em explorar da¬ 
dos pode ser limitada; entretanto, eles sao 
otimos para exibir dados de maneira concisa. 
Agora, se voce clicar duas vezes nesse grafi- 
co, voce sera capaz de girar os eixos para ter 


L£r 



3 Nao e, na verdade, errado usar um diagrama em 3D 
quando voce esta representando somente duas varia¬ 
veis. Quero dizer que nada de ruim ira lhe acontecer (a 
nao ser que voce o mostre para certos estatfsticos que o 
trancarao numa sala e farao voce escrever 75172 vezes 
no quadro “eu nao devo fazer graficos em 3D”), apenas 
nao e uma maneira clara de apresentar os dados. 


uma ideia melhor do relacionamento entre as 
tres variaveis - isso sera util para voce; contu- 
do, voce sera obrigado a decidir que angulo 
melhor representa o relacionamento quando 
quiser colocar o grafico no papel em 2D! Di- 
virta-se com o grafico e veja se voce consegue 
a mesma figura que eu (a tela proxima desse 
texto ira ajudar!) 

4.4.3 Diagrama de dispersao 
sobreposto © 

Existem dois tipos de diagramas de dis¬ 
persao que voce nao pode fazer usando gra¬ 
ficos interativos: o diagrama de dispersao so¬ 
breposto e o diagrama de dispersao matricial. 
Ambos sao muito uteis e vale a pena descobrir 
o porque. Um diagrama de dispersao sobre¬ 
posto e aquele em que muitos pares de varia¬ 
veis sao tracados nos mesmos eixos. Imagine 
que nossa pesquisadora quisesse verificar o 
papel da ansiedade pre-prova e do tempo de 
revisao no desempenho da prova (mas nao o 
relacionamento entre a ansiedade pre-prova e 
revisao); seria util tragar os relacionamentos 
entre tempo de revisao e desempenho na pro¬ 
va e entre ansiedade pre-prova e desempenho 
simultaneamente. Para tirar o melhor proveito 
desse tipo de diagrama de dispersao, mantenha 
uma variavel constante e trace-a contra outras. 
No exemplo da prova, no qual o efeito da an¬ 
siedade e do tempo de revisao no desempenho 
da prova e relevante, voce deveria tragar an¬ 
siedade (anxiety) (X) contra prova (exam) ( Y ) 
e, entao, sobrepor revisao (revise) (X) contra 
desempenho na prova (exam) ( Y ). 

Para tra£ar essas combina 9 oes, simplesmen- 
te use os menus como segue: Graphs ^Scat¬ 
ter.... (Graficos=>Espalhamento...). Isso ativa 
a caixa de dialogo da Figura 4.7, que fornece 
quatro opcoes para diferentes tipos de diagra¬ 
mas de dispersao disponiveis. Por omissao, um 
diagrama simples de dispersao e selecionado 
como e mostrado pela borda preta em volta 
da figura. Se voce deseja tracar um diagrama 
de dispersao diferente, mova o cursor sobre as 
outras figuras e clique com o botao esquerdo 
do mouse. Depois de selecionar o diagrama de 
dispersao, clique em (Definir). 
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Figura 4.6 Um diagrama de dispersao em 3 D do desempenho da prova tragado contra a ansie- 
dade pre-prova e o tempo gasto revisando. 



Figura 4.7 Caixa de dialogo do diagrama de 
dispersao principal. 


Para tragar um diagrama de dispersao so- 
breposto, clique em Overlay (Sobreposto) na 
caixa de dialogo principal do diagrama de dis¬ 


persao ( scatterplot ) (veja a Figura 4.7) e uma 
caixa de dialogo como a da Figura 4.8 apare- 
ce. Para selecionar um par de variaveis, cli¬ 
que em uma variavel da lista (isso ira aparecer 
como Variable 1 [Variavel 1] na segao rotula- 
da de Currrent Selections [Selegoes Atuais]) 
e, entao, selecione uma segunda variavel (essa 
estara listada como Variable 2 [Variavel 2]). 
Transfira o par de variaveis clicando em a. 
O par ira aparecer no espago rotulado de Y-X 
Pairs (Pares Y-X). A ordem das variaveis esta 
relacionada com o eixo em que elas estarao 
tragadas, assim, na Figura 4.8 exam (prova) 
ira aparecer no cixo_y e anxiety (ansiedade) no 
eixo x. O segundo par, exam e revise (prova 
e revisao) deve, tambem, ser transferido para 
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Figura 4.8 Caixa de dialogo para criar urn 
diagrama de dispersao sobreposto. O primeiro 
par de variaveis ja foi especificado e o segundo 
par foi selecionado, mas nao transferido para a 
lista dos pares. 


a lista de pares Y-X, de modo que exam (pro- 
va) esteja listada em primeiro lugar (e, assim, 
sera tracada no eixo y) e revise (revisao) em 
segundo lugar (assim, sera tracada no eixo x). 
Se ao transferir duas variaveis, elas nao apare- 


cerem da forma desejada, voce podera trocar 
a ordem das variaveis (e, portanto, o eixo no 
qual elas serao representadas) clicando em 
s * 0 p P o11 (trocar par). 

Fica claro, a partir da Figura 4.9, que, 
embora a ansiedade esteja negativamente rela- 
cionada ao desempenho na prova, parece que 
a variavel desempenho na prova esta positiva- 
mente relacionada ao tempo de revisao. As¬ 
sim, enquanto o tempo de revisao aumenta, o 
desempenho na prova aumenta tambem, mas, 
enquanto a ansiedade aumenta, o desempenho 
na prova diminui. O diagrama de dispersao 
sobreposto mostra de forma clara esses dife- 
rentes relacionamentos. 

4.4.4 Diagrama de dispersao matricial CD 

Em vez de trapar muitas variaveis nos 
mesmos eixos em um diagrama 3D (o que 
pode ser diffcil de interpretar com varios pares 
de variaveis), e possfvel tracar uma matriz dos 
diagramas de dispersao. Esse tipo de diagra¬ 
ma permite ver o relacionamento entre todas 
as combina§oes dos diferentes pares de va- 
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Figura 4.9 Um diagrama de dispersao do desempenho na prova versus a ansiedade pre-prova 
e tempo gasto revisando. 
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riaveis. Para obter urn diagrama de dispersao 
matricial para os dados usados no diagrama de 
dispersao sobreposto, selecione a opgao dia¬ 
grama de dispersao Matricial ( Matrix ) na cai- 
xa de dialogo principal do diagrama de disper¬ 
sao (Figura 4.7). A caixa de dialogo completa 
e mostrada na Figura 4.10: as variaveis estao 
listadas a esquerda e qualquer uma que voce 
queira representar devera ser transferida para 
a caixa rotulada de Matrix Variables (Variaveis 
Matriciais) usando a tecla _lJ. Para nossos da¬ 
dos, selecione e transfira Exam performance 
(%) [exam], Exam Anxiety [anxiety] e Time 
spent revising [revise] (Desempenho na Prova 
(%) [prova], Ansiedade Pre-Prova [ansiedade] 
e Tempo gasto revisando [revisao]) para o qua- 
dro denominado Matriz Variables (Variaveis 
Matriciais). Como ocorreu com o diagrama de 
dispersao simples, existe uma opcao de separar 
o diagrama de dispersao por uma variavel de 
grupo especificando Set Markers by... (Deter¬ 
mine marcadores por), mas nao ha necessidade 
de usar essa opgao para esses dados. O diagra¬ 
ma de dispersao resultante do desempenho na 
prova contra ansiedade pre-prova e tempo de 
revisao e mostrado na Figura 4.11. 

Os seis diagramas de dispersao na Figu¬ 
ra 4.11 representam as varias combinagoes 
de cada variavel tragada uma contra a outra. 



Figura 4.10 Caixa de dialogo para o diagra¬ 
ma de dispersao matricial. 


Assim, a grade de referencias representa os 
seguintes diagramas: 

• Bl: desempenho na prova (Y) versus an¬ 
siedade (X) 

• Cl: desempenho na prova (Y) versus 
tempo de revisao (X) 

• A2: ansiedade (Y) versus desempenho na 
prova (X) 

• C2: ansiedade (Y) versus tempo de revi¬ 
sao (X) 

• A3: tempo de revisao (Y) versus desem¬ 
penho na prova (X) 

• B3: tempo de revisao (Y) versus ansieda¬ 
de (X) 

Dessa maneira, os tres diagramas de dis¬ 
persao abaixo da diagonal da matriz sao os 
mesmos diagramas dos acima da diagonal, 
mas com eixos ao contrario. Dessa matriz 
podemos ver que o tempo de revisao e a an¬ 
siedade estao inversamente relacionados (as¬ 
sim, quanto mais tempo gasto revisando, me- 
nos ansiedade o participante teve na prova). 
Tambem, no diagrama de dispersao do tempo 
de revisao contra ansiedade (grade C2 e B3) 
parece que ha um possfvel valor atipico - ha 
um unico participante que gastou pouqufssi- 
mo tempo revisando e ficou pouco ansioso em 
relagao a prova. Como todos os participantes 
que tiveram baixa ansiedade obtiveram notas 
altas na prova, podemos deduzir que essa pes- 
soa tambem foi bem na prova (voce nao odeia 
um Alex Esperto!). Poderfamos examinaresse 
caso mais detalhadamente se achassemos que 
seu comportamento foi provocado por algum 
fator externo (como tomar estimulantes para 
o cerebro!). Os diagramas de dispersao ma¬ 
triciais sao muito convenientes para examinar 
pares de relacionamento entre variaveis. En- 
tretanto, nao recomendo traga-los para mais 
de tres ou quatro variaveis porque eles se tor- 
nam muito confusos. 

4.5 C0RRELAQA0 BIVARIADA © 

Tendo uma visao preliminar dos dados, 
podemos agora realizar a analise de correla- 
gao. Para tanto, iremos retornar aos dados da 
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Figura 4.11 O diagrama de dispersao matricial do desempenho na prova, ansiedade pre-prova e 
tempo de revisao. References na grade foram adicionadas para esclarecimentos. 


Tabela 4.1, que examinava se havia um rela- 
cionamento entre o numero de propagandas 
assistidas e o numero de pacotes de balas 
toffee comprados posteriormente. Crie duas 
colunas no editor de dados e digite esses da¬ 
dos (os preguicosos podem acessar o arquivo 
Advert.sav no site www.artmed.com.br). 

Existent dois tipos de correlagao: biva- 
riada e parcial. Uma correlagao bivariada e 
uma correla^ao entre duas variaveis (como 
foi descrito no imcio deste capitulo), enquan- 
to uma correla^ao parcial determina o rela- 
cionamento entre variaveis “controlando” o 
efeito de uma ou mais variaveis. O coeficiente 
de correla§ao momento-produto de Pearson 


(descrito anteriormente) e o ro de Spearman 

(veja a Se^ao 4.5.4) sao exemplos de coefi- 

cientes de correlacao bivariada. Para conduzir 
uma correlacao bivariada, voce precisa en- 
contrar a opcao Correlate (Correlacionar) do 
menu Analyse (Analisar). A caixa de dialogo 
principal e acessada pelo caminho do menu 
Analyse => Correlate => Bivariate ... (Anali- 
sar=>Correlacionar=>Bivariada...) e e mostra- 
da na Figura 4.12. Usando a caixa de dialogo 
e possivel selecionar quais das tres correlacoes 
voce quer determinar. O padrao estabelecido 
e a correlacao de Pearson, mas voce tambem 
pode calcular a de Spearman e a de Kendall - 
veremos as diferencas entre esses coeficientes 
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Figura 4.12 Caixa de dialogo ilustrando uma correlagao bivariada. 


de correlacao no momento apropriado. Alem 
disso, e possfvel especificar se o teste e ou nao 
de uma ou duas caudas (veja a Segao 1.8.2). 

Um teste unilateral deve ser selecionado quan- 

do voce tiver uma hipotese direcional (isto e, 
“quanto mais comerciais a pessoa assiste, mais 

pacotes de balas ela ira comprar”). Um teste 

bilateral (por omissao) deve ser usado quando 

nao se pode prever a natureza do relaciona- 

mento (isto e, “Eu nao tenho certeza se assistir 
a mais comerciais estara associado com o au- 
mento ou a diminuigao de pacotes de balas que 
uma pessoa compra”). 

Tendo acessado a caixa de dialogo princi¬ 
pal, voce devera perceber que as variaveis do 
editor de dados estao listadas no lado esquer- 
do da caixa de dialogo (Figura 4.12). Existe 
um quadro vazio rotulado de Variables (Va¬ 
riaveis) no lado direito. Voce pode selecionar 
qualquer variavel da lista usando o mouse e 
transferi-la para a caixa das Variaveis ( Varia¬ 
bles) clicando em O SPSS ira criar uma 

tabela de coeficientes de correlacao para todas 
as combinagdes de variaveis possfveis. Essa 
tabela e chamada de matriz de correlates. 
Para nosso exemplo atual, selecione as varia¬ 
veis Number of Adverts Watched [adverts] 
e Number of Packets Bought [packets] (Nu- 
mero de Comerciais Assistidos [comerciais] e 
Numero de Pacotes Comprados [pacotes]) e 


transfira todas para a lista de variaveis. Uma 
vez selecionadas as variaveis de interesse, 
voce pode escolher entre tres coeficientes de 
correlagao: o de Pearson, o ro de Spearman e 
o tau de Kendall. Qualquer um deles pode ser 
selecionado clicando na caixa de marcar. 

Se voce clicar em 0p ‘° n * (Opgoes), outra 
caixa de dialogo aparece com duas opcoes de 
estatfsticas ( Statistics ) e duas opcoes para va- 
lores desconhecidos ( missing ) (Figura 4.13). A 
opgao estatfsticas estara ativa somente quando 
a correlagao de Pearson for selecionada; se 
a correlacao de Pearson nao for selecionada, 
entao essas opcoes estarao desabilitadas (elas 
aparecem num cinza claro em vez de preto 
e voce nao pode ativa-las). Essa desativagao 
ocorre porque essas duas opgoes sao impor- 



Figura 4.13 Caixa de dialogo para as opgoes 
da correlagao bivariada. 
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tantes somente para dados parametricos e a 
correlagao de Pearson e usada com esse tipo 
de dados. Se voce selecionar a caixa de mar- 
car rotulada de Means (Medias) e Standard 
deviations (desvios padrao), o SPSS calculara 
a media e o desvio padrao de todas as varia- 
veis selecionadas para serem correlaciona- 
das. Se voce ativar a caixa de marcar rotulada 
Cross-product deviation (desvio do produto 
cruzado) e covariances (covariancias), o SPSS 
fornecera os valores dessas estatfsticas para 
cada variavel sendo correlacionada. O desvio 
do produto cruzado nos da a soma dos des¬ 
vios em relagao a medida de cada variavel e e 
simplesmente o numerador (metade acima) da 
equacao (4.2). As opgoes de covariancia nos 
dao os valores da covariancia entre as varia- 
veis, os quais poderiam ser calculados ma- 
nualmente usando a equacao (4.2). Em outras 
palavras, esses valores das covariancias sao os 
desvios dos produtos cruzados divididos por 
(N - 1) e representam o coeficiente de correla- 
cao nao-padronizado. Em muitos casos, voce 
nao precisara usar essas opgoes, mas, ocasio- 
nalmente elas poderao ser uteis! 

Para ilustrar o que essas opgoes fazem, 
selecione-as para os dados dos comerciais. 
Deixe as opgoes selecionadas na caixa de 
dialogo principal como elas estao. O resulta- 
do do SPSS e mostrado na Saida 4.1. A segao 
rotulada de Sums of Squares e Cross-products 


(Soma dos Quadrados e Produtos Cruzados) 
nos mostra o produto cruzado (17 nesse exem- 
plo) que calculamos da equagao (4.2) e a soma 
dos quadrados para cada variavel. A soma dos 
quadrados e calculada no topo da equagao 
(4.1). O valor da covariancia entre as duas va- 
riaveis e 4,25, que e o mesmo valor que foi 
calculado da equacao (4.2). A covariancia de 
uma unica variavel e o mesmo que a varian- 
cia da variavel (assim, a variancia para o mi- 
mero de comerciais e 2,8 e a variancia para 
o numero de pacotes comprados e 8,5). Essas 
variancias podem ser calculadas manualmente 
pela equagao (4.1). Note, tambem, que o coe¬ 
ficiente de correlaqao de Pearson entre as duas 
variaveis e 0,871, o mesmo valor calculado na 
Segao 4.22. 

4.5.1 Coeficiente de correlagao de 
Pearson © 

O coeficiente de correlagao de Pearson 
foi descrito detalhadamente no inicio deste 
capitulo. Para aqueles que nao estao familia- 
rizados com a estatistica basica, nao e relevan- 
te falar sobre media a nao ser que tenhamos 
dados mensurados num intervalo ou num ni- 
vel de razao (para uma revisao, veja o Qua¬ 
dra 2.1 ou Field e Hole, 2003). A correlacao 
de Pearson requer dados intervalares para ser 
uma medida precisa do relacionamento linear 


Saida 4.1 do SPSS Procedimento correlagao 


Correlations (Correlagoes) 




Adverts Watched 
(Comerciais vistos) 

Number of Packets 
(Numero de pacotes) 

Adverts Watched 

Pearson Correlation (Correlagao de Pearson) 

1.000 

0.871 

(Comerciais vistos) 

Sig. (2 tailed) (Sig. bilateral) 


0.054 


Sum of Squares and Cross-products (Soma 

11.200 

17.000 


dos quadrados e produtos cruzados) 




Covariance (Covariancia) 

2.800 

4.250 


N 

5 

5 

Number of Packets 

Pearson Correlation (Correlagao de Pearson) 

0.871 

1.000 

(Numero de pacotes) 

Sig. (2 tailed) (Sig. bilateral) 

0.054 



Sum of Squares and Cross-products (Soma 

17.000 

34.000 


dos quadrados e produtos cruzados) 




Covariance (Covariancia) 

4.250 

8.500 


N 

5 

5 









Descobrindo a Estatistica Usaimdo o SPSS 141 


entre duas variaveis. Entretanto, se voce quer 
determinar se o coeficiente de correlagao e 
significativo, mais suposigoes sao necessarias: 
para que a estatistica teste seja valida os dados 
devem ser normalmente distribufdos. Embora 
queiramos que ambas as variaveis sejam dis- 
tribuidas normalmente, ha uma excecao para 
essa regra: uma das variaveis pode ser cate- 
gorica contanto que ela tenha somente duas 
categorias (na realidade, se voce olhar a Segao 
4.5.6, vera que isso e o mesmo que fazer um 
teste-f, mas estou me apressando um pouco). 
De qualquer maneira, se os seus dados nao sao 

normais (veja o Capitulo 3) ou nao sao mensu- 

rados em intervalos, voce nao deve selecionar 

a correlagao de Pearson (Figura 4.14). 

Acesse novamente as dados do ar- 
quivo ExamAnxiety.sav para que pos- 
samos calcular a correlagao entre o de- 
sempenho na prova, tempo de revisao e 
ansiedade pre-prova. Os dados do desem- 
penho na prova estudados sao parametricos 

e, assim, a correlagao de Pearson pode ser 
aplicada. Acesse a caixa de dialogo principal 
das bivariate correlations (correlagoes biva- 
i iadas) (Analyze =>Correlate =>Bivarite...) 
(Analisar=>Correlacionar=>Bivariada...) e 
transfira exam, anxiety e revise (prova, an¬ 
siedade e revisar) para o quadro rotulado de 
Variables (Variaveis) (Figura 4.15). A caixa 
de dialogo tambem nos permite especificar 



Figura 4.14 Karl Pearson. 


se o teste e uni ou bilateral. Testes unilaterais 
devem ser usados quando existe uma diregao 
especifica para a hipotese que esta sendo tes- 
tada e testes bilaterais devem ser usados quan¬ 
do um relacionamento e esperado, mas a dire- 
gao do relacionamento nao e previsrvel. Nosso 
pesquisador previu que em altos indices de 
ansiedade o desempenho da prova seria baixo. 
Portanto, o teste para essas variaveis deve ser 
unilateral porque antes dos dados serem cole- 



Figura 4.15 Caixa de dialogo completa para os dados do desempenho na prova. 
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tados o pesquisador previu um tipo especffico 
de relacionamento. E mais, uma correlacao 
positiva entre tempo de revisao e desempenho 
na prova foi previsto, assim, esse teste tambem 
deve ser unilateral. Para assegurar que iremos 
obter os valores de significancia unilaterais 
selecione K °"*-'**" (unilateral) e clique em °* . 

A safda 4.2 do SPSS fornece uma matriz 
dos coeficientes de correlacao para as tres va- 
riaveis. Embaixo de cada coeficiente de corre¬ 
lacao e apresentado o valor da significancia da 
correlacao e o tamanho da amostra (AO no qual 
ele e baseado. Cada variavel e perfeitamente 
correlacionada com ela propria (obviamente) 
e, assim, r= 1 ao longo da diagonal na tabela. 
O desempenho na prova e negativamente rela- 
cionado a ansiedade pre-prova com um coefi¬ 
ciente r = —0,441 e existe uma probabilidade 
de menos de 0,001 que esse coeficiente de cor¬ 
relacao tenha ocorrido por acaso numa amostra 
de 103 pessoas (como esta indicado pelos dois 
asteriscos depois do coeficiente). Esse valor da 
significancia nos diz que a probabilidade des- 
sa correlacao ser “um golpe de sorte” e muito 
baixa (proximo a zero, na verdade). Desde ja, 
podemos ter certeza de que o relacionamen¬ 
to entre desempenho na prova e ansiedade e 
genufno. Geralmente, cientistas sociais acei- 
tam qualquer valor de probabilidade abaixo 


de 0,05 como sendo estatisticamente signifi¬ 
cative e, assim, tal valor e considerado como 
um indicativo de um efeito genufno (o SPSS 
ira marcar qualquer coeficiente de correlacao 
significativo, nesse nfvel, com um asterisco). 
A safda mostra, tambem, que o desempenho 

na prova esta positivamente relacionado com o 

tempo gasto revisando, com um coeficiente de 
r = 0,397, o qual tambem e significativo a p < 

0,001. Finalmente, a ansiedade pre-prova pa- 

rece ser negativamente relacionada ao tempo 
gasto revisando (r = -0,709, p < 0,001). 

Em termos psicologicos, isso tudo sig- 
nifica que, a medida que a ansiedade sobre 
uma prova aumenta, a percentagem de acertos 
obtida naquele exame diminui. Inversamente, 
a medida que o tempo de revisao aumenta, a 
percentagem obtida na prova aumenta. Final¬ 
mente, a medida que o tempo de revisao au¬ 
menta, a ansiedade do estudante sobre a prova 
diminui. Assim, ha um inter-relacionamento 
complexo entre as tres variaveis. 

4.5.2 Um alerta sobre interpretagao: 
Causalidade © 

Devemos ser cuidados ao interpretar 

coeficientes de correlacao porque eles nao dao 

indicacao da direcao da causalidade. Assim, 


Saida 4.2 do SPSS Saida do SPSS para a correlagao de Pearson 

Correlations (Correlagoes) 



Exam 

performance (%) 
(Desempenho 
na prova) 

Exam Anxiety 
(Ansiedade 
pre-prova) 

Time spent 
revising 
(Tempo gasto 
revisando) 

Exam performance 

Pearson Correlation (Correlagao 

1.000 

- 0.441** 

0.397** 

(%) 

de Pearson) 




(Desempenho na 

Sig. (1 tailed) (Sig. unilateral) 


0.000 

0.00 

prova) 

N 

103 

103 

103 

Exam Anxiety 

Pearson Correlation (Correlagao 

- 0.441** 

1.000 

- 0.709** 

(Ansiedade pre- 

de Pearson) 




prova) 

Sig. (1 tailed) (Sig. unilateral) 

0.000 


0.000 


N 

103 

103 

103 

Time spent revising 

Pearson Correlation (Correlagao 

0.397** 

- 0.709** 

1.000 

(Tempo gasto re- 

de Pearson) 




visando) 

Sig. (1 tailed) (Sig. unilateral) 

0.000 

0.000 



N 

103 

103 

103 


Correlation is significant at the .01 level (1-tailed) (Correlagao e significativa ao mvel de 0,01 (unilateral)) 
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em nosso exemplo, embora possamos concluir 
que o desempenho na prova diminui a medida 
que a ansiedade pre-prova aumenta, nao pode- 
mos dizer que uma alta ansiedade pre-prova 
causa pessimo desempenho na prova. Essa 
precaugao tem dois motivos: 

• O problema da terceira variavel: Em 

qualquer correlagao bivariada a causa- 
lidade entre duas variaveis nao pode ser 
dada por certo, porque podem ter outras 
variaveis, medidas ou nao, afetando os re- 
sultados. Isso e conhecido como o proble¬ 
ma da terceira variavel ou o tertium quid. 
No nosso exemplo, voce pode ver que o 
tempo de revisao se relaciona significati- 
vamente a ambos, desempenho na prova 
e ansiedade pre-prova, e nao ha maneira 
de dizer qual das duas variaveis indepen- 
dentes, se ambas, causa a mudanga no de¬ 
sempenho na prova. Assim, se tivessemos 
medido somente a ansiedade pre-prova e 
o desempenho na prova, poderlamos ter 
assumido que a alta ansiedade pre-prova 
causou pessimo desempenho na prova. 
Entretanto, esta claro que pessimo desem¬ 
penho na prova tambem pode ser explica- 
do pela falta de revisao. Pode haver mui- 
tas variaveis adicionais que influenciam 
as variaveis correlacionadas e essas va¬ 
riaveis podem nao ter sido medidas pelo 
pesquisador. Assim, poderia ser outra va¬ 
riavel, nao mensurada, que afeta o tempo 
de revisao e a ansiedade pre-prova. Field e 
Hole (2003) dao o exemplo da descoberta 
de Broca de um forte relacionamento en¬ 
tre genero e tamanho do cerebro: o cere- 
bro das mulheres sao, em geral, menores 

do que os dos homens. Isso foi, naquela 

epoca, usado como evidencia para argu- 
mentar que as mulheres eram intelectual- 

mente inferiores aos homens. O problema 

obvio e que esse relacionamento nao leva 

em consideragao o tamanho do corpo: 

pessoas com corpos maiores tem cerebros 

maiores independentemente da habilidade 

intelectual. Gould (1981) analisou nova- 

mente os dados e demonstrou que o forte 

relacionamento entre genero e tamanho 


do cerebro desapareceu quando se levou 

em conta o tamanho do corpo! 

• Diregao da causalidade: Coeficientes de 
correlagao nada dizem sobre qual variavel 
causa a alteragao na outra. Mesmo se pu- 
dessemos ignorar o problema da terceira 
variavel descrito acima, e pudessemos 
assumir que as duas variaveis correlacio¬ 
nadas eram as unicas importantes, o coe- 
ficiente de correlagao nao indica em qual 
diregao a causalidade opera. Assim, embo¬ 
ra seja tentador concluir que a ansiedade 
pre-prova causa a mudanga no desempe¬ 
nho na prova, nao existe razao estatistica 
de que o desempenho na prova nao possa 
causar a mudanga na ansiedade pre-prova. 
Embora essa ultima conclusao nao faga 
sentido (porque a ansiedade foi medida 
antes do desempenho na prova), a correla¬ 
gao nao nos diz que isso nao e verdade. 

4.5.3 Utilizando o R 2 para 
interpretagao CD 

Embora nao possamos tirar conclusoes di- 
retas sobre causalidade, podemos levar o coefi- 
ciente de correlagao um passo a frente elevan- 
do-o ao quadrado. O coeficiente de correlagao 
ao quadrado (conhecido como o coeficiente de 
determinagao, R 2 ) e uma medida da quantidade 
de variagao em uma variavel que e explicada 
pela outra. Por exemplo, podemos olhar o rela¬ 
cionamento entre ansiedade pre-prova e desem¬ 
penho na prova. O desempenho na prova varia 
de pessoa para pessoa devido a diversos fatores 
(habilidades diferentes, diferentes nlveis de 
preparagao e assim por diante). Se adicionasse- 
mos todas as variabilidades (como quando cal- 
culamos a soma dos quadrados na Segao 1.4.1), 
terlamos uma estimativa de quanta variagao 
existe no desempenho na prova. Podemos usar, 
entao, o R 2 para nos dizer quanto dessa variabi- 
lidade e provocado pela ansiedade pre-prova. 
Essas duas variaveis tinham uma correlagao de 
—0,4410 e, assim, o valor de R 2 sera (-0,4410) 2 
= 0,194. Esse valor nos diz quanto da varia¬ 
gao no desempenho na prova pode ser explica- 
do pela ansiedade pre-prova. Se convertermos 
esse valor em percentagem, podemos dizer que 
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ansiedade pre-prova tem 19,4% de variabili- 

dade no desempenho na prova. Assim, embo- 
ra a ansiedade pre-prova estivesse altamente 

correlacionada com o desempenho na prova, 

ela contribui somente com 19,4% da variaqao 

nos escores da prova. Colocando esse valor 
em perspectiva, isso nos leva a 80,6% da va- 
riabilidade ainda a ser contabilizada por outras 
variaveis. Devo ressaltar que embora R 2 seja 
uma medida util da importancia de um efeito, 
ele nao pode ser usado para inferir relaciona- 
mentos causais. Embora geralmente falemos 
em termos de “a variancia em y ser responsavel 
por x” ou mesmo a variacao em uma variavel 
explicada pela outra, isso ainda nada diz sobre 
qual o caminho da causalidade. Assim, mesmo 

que a ansiedade pre-prova seja responsavel por 

19,4% da variacao em escores de exames, ela 

nao necessariamente causa a varia£ao. 

4.5.4 Coeficiente de correlagao de 

O coeficiente 
de correlagao de 

Spearman, r s , e 
uma estatfstica 
nao-parametrica e, 

assim, pode ser 

usada quando os 

dados violarem 
suposigSes para- 

metricas, tais 
como dados nao-normais (veja o Capftulo 3). 

O teste de Spearman trabalha classificando os 
dados em primeiro lugar e entao aplicando a 
equagao de Pearson (equaqao (4.3)) aos dados 
ordenados. Como professor de estatfstica, es- 
tou sempre interessado em fatores que deter- 
minam se um estudante ira bem em um curso 
de estatfstica. Um fator consideravelmente 
importante e seu conhecimento previo em ma¬ 
tematica (no mfnimo a experiencia previa ira 
determinar se uma equacao faz sentido!). Ima¬ 
gine que eu peguei 25 alunos e olhei suas no- 
tas no curso de estatfstica no final do seu pri¬ 
meiro ano na universidade. Na Gra Bretanha, 
o estudante pode obter um conceito de primei- 


ra classe, um conceito de segunda classe supe¬ 
rior, um conceito de segunda classe inferior, 
um de terceira classe, passar ou reprovar. Es¬ 
ses conceitos sao categorias, mas eles tem 
uma ordem (um conceito de segunda classe 
superior e melhor do que um de segunda infe¬ 
rior). Eu poderia, tambem, perguntar a esses 
alunos que conceito eles obtiveram nas provas 
de matematica do GCSE. Na Gra Bretanha, 
GCSEs sao provas escolares feitas com a ida- 
de de 16 anos que levam os conceitos A, B, C, 
D, E ou F. Novamente, esses conceitos sao ca¬ 
tegorias que tem uma ordem de importancia 
(um A e melhor do que todos os outros con¬ 
ceitos). Quando voce tem categorias como es- 
sas que podem ser ordenadas de uma maneira 
significativa, os dados sao denominados de 
ordinais. Os dados nao sao intervalares por- 
que um conceito de primeira classe cobre 30% 
do intervalo (70% - 100%) enquanto um de 
segunda superior atinge somente 10% do in¬ 
tervalo (60% - 70%). Quando os dados foram 
medidos somente no nfvel ordinal eles sao 
chamados de nao-parametricos e a correlacao 
de Pearson nao e apropriada. Portanto, o coe¬ 
ficiente de correlaqao de Spearman e usado. 
Os dados para esse estudo estao no arquivo 
grades.sav. Eles estao organizados em duas 
colunas: uma rotulada de stats e uma rotulada 
de gcse. Cada uma das categorias descritas 
acima foi codificada com um valor numerico. 
Em ambos os casos, o conceito mais alto (pri¬ 
meira classe ou conceito A) foi codificado 
com o valor de 1, com as categorias subse- 
quentes rotuladas 2, 3 e assim por diante. Note 
que para cada valor numerico providenciei um 
rotulo (como fizemos para codificar varia¬ 
veis). 

O procedimento para determinar a corre- 
laqao de Spearman (Figura 4.16) e o mesmo 
para a correlaqao de Pearson exceto que na 
caixa de dialogo das correlates bivariadas 
(Figura 4.15), precisamos selecionar P s»*im*n 
e nao a opqao da corrclaqao de Pearson. Nes- 
se estagio, voce deve tambem especificar se 
quer um teste uni ou bilateral. Para o exemplo 
acima, previ que as melhores notas no GCSE 
de matematica seriam correlacionadas com 


Spearman © 
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Figura 4.16 Charles Spearman, classificando 
furiosamente. 


melhores notas no meu curso de estatistica. 
A hipotese e direcional e um teste unilateral 
deve ser selecionado. 

A Saida 4.3 do SPSS mostra a correlacao 
de Spearman nas variaveis stasts e gcse. Essa 
saida e muito similar aquela da correlacao 
de Pearson: uma matriz e mostrada dando o 
coeficiente de correlacao entre duas variaveis 
(0,455), embaixo esta o valor de significancia 
desse coeficiente (0,011) e finalmente o tama- 
nho da amostra (25). O valor da significancia 


para esse coeficiente de correlacao e menor 
do que 0,05; portanto, pode ser concluido 
que existe um relacionamento significativo 
entre os conceitos dos estudantes no GCSE 
de matematica e o seu conceito no curso de 
estatistica. A propria correlacao e positiva: as- 
sim, podemos concluir que a medida que os 
conceitos no GCSE aumentam, existe uma 
melhoria correspondente nos conceitos de es¬ 
tatistica. Dessa maneira, a hipotese foi susten- 
tada. Finalmente, e bom notar que o valor de 
N corresponde ao niimero de observapoes que 
fizemos. Se ele nao corresponded entao dados 
podem ter sido excluidos por alguma razao. 

4.5.5 Tau de Kendall 

(nao-parametrico) ® 

A tau de Kendall, r, e outra correlacao 
nao-parametrica e deve ser usada em vez do 

coeficiente de Spearman quando voce tem um 
conjunto pequeno de dados com um grande 
niimero de postos empatados. Isso significa 
que se voce ordenar todos os escores e mui- 

tos deles apresentarem o mesmo posto, o tau 

de Kendall deve ser usado. Embora a estatis¬ 
tica de Spearman seja a mais popular dos dois 
coeficientes, acreditamos que a estatistica de 

Kendall e realmente uma melhor estimativa da 
correlacao na populacao (veja Howell, 1997, 

p. 293). Dessa maneira, podemos estabelecer 

generalizacoes mais precisas da estatistica de 


Saida 4.3 


Correlations (Correlates) 



Statistics Grade 
(Nota em 
Estatistica) 

GCSE Maths 
Grade 

(Nota GCSE em 
Matematica) 

Spearmam's 

Statistics Grade (Nota 

Correlation Coefficient (Coefi- 

1.000 

0.455* 

rho (Ro de 

em Estatistica) 

ciente de Correlagao) 



Spearman) 


Sig. (1 tailed) (Sig. unilateral) 


0.011 



N 

25 

25 


GCSE Maths Grade 

Correlation Coefficient (Coefi- 

0.455* 

1.000 


(Nota GCSE em Mate- 

ciente de Correlagao) 




matica) 

Sig. (1 tailed) (Sig. unilateral) 

0.011 




N 

25 

25 


Correlation is significant at the .05 level (1-tailed) (A correlagao e significativa ao nlvel de 0,05 (unilateral)) 
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Kendall do que a de Spearman. Para deter- 
minar a correlagao de Kendall para os dados 
das notas de estatfstica, simplesmente siga os 
mesmos passos realizados para obter as corre- 
lagoes de Pearson e Spearman, mas selecione 
P K»ndairstau-i» e retire a selegac da opgao Pearson. 
A safda e praticamente a mesma da correlagao 
de Spearman. 

Voce notara da Safda 4.4 do SPSS que o 
valor real desse coeficiente de correlagao e 
menor do que o de Spearman (diminuiu de 
0,455 para 0,354). Apesar da diferenga nos 
coeficientes de correlagao, podemos ainda 
interpretar esse resultado como sendo um re- 
lacionamento positivo altamente significati¬ 

ve (porque o valor da significancia de 0,015 
e menor do que 0,05). Entretanto, o valor do 
coeficiente de Kendall e uma avaliagao mais 

precisa do que a correlagao na populacao se- 
ria. Da mesma forma que com a correlagao de 
Pearson, nao podemos assumir que os con- 
ceitos no GCSE causaram uma melhoria nos 
conceitos em estatfstica. 

4.5.6 Correlagoes bisserial e bisserial 
por ponto © 

As correlates bisserial e 
[jF - bisserial por ponto apresentam 

H '“2®' V uma diferenga conceitual com 
V ®'y um calculo tambem diferente. 

Esses coeficientes de correla¬ 


gao sao usados quando uma das duas variaveis 
e dicotomica (isto e, ela e categorica com so- 
mente duas categorias). Um exemplo de uma 
variavel dicotomica e a gravidez, porque uma 
mulher pode ou nao estar gravida (ela nao 
pode estar “ligeiramente gravida”). Geralmen- 
te, e necessario investigar relacionamentos 
entre duas variaveis quando uma das variaveis 
e dicotomica. A diferenca entre usar as corre- 
lacoes bisseriais e bisseriais por ponto depen- 
de de a variavel dicotomica ser discreta ou 
contfnua. Essa diferenga e muito sutil. Uma 
discreta ou dicotomica verdadeira e uma va¬ 
riavel para a qual nao existe continuidade sub- 
jacente entre as categorias. Um exemplo disso 
e alguem estar vivo ou morto: uma pessoa so- 
mente pode estar viva ou morta, ela nao pode 
estar “ligeiramente morta”. Embora voce pos- 
sa descrever uma pessoa como estando “quase 
morta” - especialmente depois de beber muito 
- ela ainda esta viva se estiver respirando! 
Portanto, nao ha continuidade entre as duas 
categorias. Entretanto, e possfvel haver dico- 
tomia se existe continuidade. Um exemplo e 
passar ou reprovar num teste de estatfstica: al- 
gumas pessoas irao simplesmente ser reprova- 
das enquanto outras irao ser reprovadas por 
uma margem muito grande; da mesma forma, 
algumas pessoas irao passar raspando enquan¬ 
to outras irao gabaritar. Assim, embora os par- 
ticipantes estejam somente entre duas catego¬ 
rias, existe claramente uma continuidade 


Saida 4.4 


Correlations (CorrelaQoes) 



Statistics Grade 
(Nota em 
Estatfstica) 

GCSE Maths 
Grade 

(Nota GCSE em 
Matematica) 

Kendall's 

Statistics Grade 

Correlation Coefficient (Coefi- 

1.000 

0.354* 

tau b 

(Nota em Estatfstica) 

ciente de Correlagao) 



(Tau b de Ken- 


Sig. (1 tailed) (Sig. unilateral) 


0.015 

dall) 


N 

25 

25 


GCSE Maths Grade 

Correlation Coefficient (Coefi- 

0.354* 

1.000 


(Nota GCSE em Mate- 

ciente de Correlagao) 




matica) 

Sig. (1 tailed) (Sig. unilateral) 

0.015 




N 

25 

25 


*A correlagao e significativa ao nfvel de 0,05 (unilateral). 
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subjacente de onde as pessoas estao. Com sor- 
te, esta claro que nesse caso existe algum tipo 
de dicotomia contfnua subjacente, porque al- 
gumas pessoas passaram ou foram reprovadas 
mais dramaticamente do que outras. O coefi- 
ciente de correlacao bisserial por ponto (r pb ) 
e usado quando uma variavel e uma dicotomia 
discreta (por exemplo, gravidez) enquanto o 
coeficiente de correlacao bisserial (r b ) e usa¬ 
do quando uma variavel e uma dicotomia con- 
tinua (por exemplo, passar ou reprovar numa 
prova). O coeficiente de correlacao bisserial 
nao pode ser calculado diretamente no SPSS: 
primeiro temos que calcular o coeficiente de 
correlacao bisserial por ponto e, entao, usar 
uma equacao para ajustar esse valor. 

Imagine que voce esta interessado no 
relacionamento entre o genero de um gato 
e quanto tempo ele passa longe de casa (o 
que posso dizer? Eu amo gatos, assim, essas 
coisas me interessam). Ouvi dizer que gatos 
machos desaparecem por muito tempo peram- 
bulando por longas distancias na vizinhanca 
(algo sobre hormonios levando-os a encontrar 
parceiras), enquanto as femeas tendem ser 
mais caseiras. Assim, usei dessa desculpa para 
visitar muitos dos meus amigos e seus gatos. 
Anotei o genero do gato e entao pedi ao dono 
para anotar o numero de horas que seu gato 
ficava ausente de casa por semana. E claro que 
o tempo gasto longe de casa e medido num 
mvel intervalar - e vamos assumir que ele sa- 


tisfaz as outras hipoteses sobre os dados para- 
metricos - enquanto o genero do gato e uma 
dicotomia discreta. Uma correlacao bisserial 
por ponto tem que ser calculada e isso e sim- 
plesmente a correlacao de Pearson quando a 
variavel dicotomica e codificada com 0 numa 
categoria e 1 na outra (na verdade, voce pode 
usar qualquer valor e o SPSS ira trocar o mais 
baixo para 0 e o mais alto para 1 quando fizer 
os calculos). Assim, para calcular essas corre- 
lacoes com o SPSS, atribua codigos a variavel 
gender (genero) como foi descrito na Secao 
2.4.4 (nos dados ja salvos o codigo 1 e para 
machos e 0 e para femeas). A variavel time 
(tempo) simplesmente tem o tempo, em horas, 
descrito como normal. Esses dados estao no 
arquivo pbcorr.sav. Determine a correlacao 
de Pearson (como na Secao 4.5.1). 

A safda do SPSS 4.5 mostra a matriz de 
correlacoes de time e gender (tempo e gene¬ 
ro). O coeficiente de correlacao bisserial por 
ponto e r pb = 0,378, o qual tem um valor de 
significancia unilateral de 0,001. O valor da 
significancia dessa correlacao e realmente a 
mesmo que obterfamos se fosse feito um teste 
t independente para esses dados (veja o Capf- 
tulo 7). O sinal da correlacao (isto e, se o rela¬ 
cionamento e positivo ou negativo) ira depen- 
der inteiramente da maneira que a codificacao 
das variaveis dicotomicas for feita. Para pro- 
var isso, nesse caso, o arquivo de dados pb¬ 
corr.sav tem uma variavel extra chamada de 


Saida 4.5 


Correlations (Correlacoes) 



Time Away from 
Home (Hours) 
(Tempo longe de 
caso (Horas)) 

Gender of Cat 
(Sexo do gato) 

Time Away from Home (Hours) 

Pearson Correlation (Correlagao de 

1.000 

0.378 

(Tempo longe de caso (Horas)) 

Pearson) 




Sig. (1 tailed) (Sig. unilateral) 


0.001 


N 

60 

60 

Gender of Cat 

Pearson Correlation (Correlagao de 

0.378* 

1.000 

(Sexo do gato) 

Pearson) 




Sig. (1 tailed) (Sig. unilateral) 

0.001 



N 

60 

60 


A correlagao e significativa ao nfvel de 0,01 (unilateral). 








148 Andy Field 


recode (recodificar) que e a mesma da varia- 
vel gender (genero), exceto que a codificagao 
e inversa (1 = femea, 0 = macho). Se voce 
repetir o calculo da correlagao de Pearson 
usando recode (recodificar) em vez de gen¬ 
der (genero), descobrira que o coeficiente de 
correlagao agora se torna —0,378. O sinal do 
coeficiente e completamente dependente do 
codigo da categoria que voce determinar e, 
assim, temos de ignorar toda a informagao so- 
bre a diregao do relacionamento. Entretanto, 
podemos ainda interpretar R 2 como anterior- 
mente. Assim, nesse exemplo, R 2 = 0,378 2 = 
0,143. Portanto, podemos concluir que gene¬ 
ro contribui por 14,3% da variagao do tempo 
gasto fora de casa. 

jjfriagine agora que queremos converter a 
correlagao bisserial por ponto no coeficien¬ 
te de correlagao bisserial (r b ) (porque alguns 
dos gatos machos foram castrados e, assim, 
pode haver um continuum de masculinidade 
subjacente a variavel genero). Devemos usar 
a equagao (4.4) na qual P l 6 a proporgao dos 
casos que calram na categoria 1 (o numero de 
gatos machos) ef,e a proporgao dos casos 
que calram na categoria 2 (o numero de ga¬ 
tos femeas). Nessa equagao, y e a ordenada da 
distribuigao normal no ponto onde existe P, % 
da area de um lado e P 2 % no outro (isso ficara 
mais claro com um exemplo): 


'pb 


JUvv 


y 


(4.4) 



Para calcular l\ e P 2 sim- 
plesmente usamos o menu 
Analyze=>Descriptive Statis- 
tics=>Frequencies (Anali- 
sar=>Estatlstica descriti- 
va=>Freqiiencias) e selecionamos a variavel 
gender (genero). Nao ha necessidade de cli- 
car em mais nenhuma opgao, pois os valores 
por omissao lhe darao tudo o que voce precisa 
saber (isto e, a percentagem dos gatos que sao 
machos ou femeas). Isso resulta em 53,3% da 
amostra sao femeas (isso e P 2 ) enquanto os 
restantes 46,7% sao machos (isso e PJ. Para 
calcular y, usamos esses valores e os valores 


da distribuigao normal exibidos no Apendice 
A. 1. Encontre a ordenada onde a curva normal 
e dividida em 0,467 como a porgao menor e 
0,533 como a pogao maior (na verdade, tere- 
mos de usar os valores mais proximos daque- 
les que sao 0,4681 e 0,5319, respectivamente). 
O valor da ordenada e 0,3977. Se substituir- 
mos esses valores na equagao (4.4), obteremos 
0,475 (veja abaixo), o que e um valor mais 
alto do que a correlagao bisserial por ponto 
(0,378). Portanto, a escolha do coeficiente de 
correlagao pode fazer uma diferenga substan- 
cial no resultado. Voce deve, portanto, ter cui- 

dado ao decidir se sua variavel dicotomica tern 
uma continuidade subjacente ou se ela e uma 

verdadeira variavel discreta. 

r b= r pb yJ(PiP 2 ) 

y 

_ (0,378)^(0,533x0,467 
0,3977 

= 0,475 


4.6 CORRELAQAO PARCIAL © 

4.6.1 A teoria por tras da correlagao 
parte e parcial © 



Mencionei anteriormente 
que existe um tipo de correla¬ 
gao que nos permite ver o rela¬ 
cionamento entre duas varia- 
veis quando o efeito de uma 
terceira variavel e constante. Por exemplo, 
analises dos dados da ansiedade pre-prova (no 
arquivo ExamAnxiety.sav) mostraram que o 
desempenho na prova esta negativamente rela- 
cionado com a ansiedade pre-prova, mas posi- 
tivamente relacionado ao tempo de revisao e o 
proprio tempo de revisao estava negativamen¬ 
te relacionado com a ansiedade pre-prova. 
Esse cenario e complexo, mas dado que sabe- 
mos que o tempo de revisao esta relacionado a 
ambos, ansiedade pre-prova e desempenho na 
prova, entao, se queremos uma medida pura 
do relacionamento entre ansiedade pre-prova 
e desempenho na prova, devemos levar em 

















Descobrindo a Estatistica Usaimdo o SPSS 149 


conta a influencia do tempo de revisao. Usan- 
do os valores de R * 2 para esses relacionamen- 
tos, sabemos que a ansiedade pre-prova con- 
tribui com 19,4% da variancia do desempenho 
na prova, que o tempo de revisao contribui 
com 15,7% da variancia no desempenho na 
prova e que o tempo de revisao contribui com 
50,2% da variancia na ansiedade pre-prova. 
Se o tempo de revisao contribui com metade 
da variancia na ansiedade pre-prova, parece 
viavel que pelo menos alguns dos 19,4% da 
variancia no desempenho na prova debitada a 
ansiedade e a mesma variancia que contribui 
no tempo de revisao. Como tal, alguma va¬ 
riancia no desempenho da prova explicada 
pela ansiedade pre-prova nao e unica e pode 
ser atribuida ao tempo de revi sao. Uma corre- 

Iactio entre duas variaveis em que os efeitos 
de outras variaveis sao constantes e conhe- 
cida como uma correlagao parcial. 

A Figura 4.17 ilustra o princfpio por tras 
da correlacao parcial. Na parte 1 do diagrama 
ha uma caixa denominada Exam Performance 
(Desempenho na prova) que representa a va¬ 
riagao total nos escores da prova (esse valor 
seria a variancia do desempenho na prova). 
Existe, tambem, uma caixa que representa 
uma variagao na ansiedade pre-prova (nova- 
mente, essa e a variancia daquela variavel). 
Ja sabemos que a ansiedade pre-prova e o de¬ 
sempenho na prova compartilham 19,4% da 
sua variagao (esse valor e o coeficiente de cor¬ 
relagao ao quadrado). Portanto, as variagoes 
dessas duas variaveis se sobrepoem (porque 
elas compartilham a variancia) criando uma 
terceira caixa (aquela com linhas diagonals). 
A sobreposigao dessas caixas representando 
desempenho na prova e ansiedade pre-prova e 
a variancia comum. Da mesma forma, na parte 

2 do diagrama a variancia compartilhada entre 
o desempenho na prova e tempo de revisao 
esta ilustrada. O tempo de revisao compartilha 
15,7% da variagao nos escores na prova. Essa 
variagao compartilhada e representada pela 
area de sobreposigao (preenchida com linhas 
diagonals). Sabemos que o tempo de revisao 
e a ansiedade pre-prova tern em comum 50% 
das suas variagoes, portanto, e muito provavel 


que alguma variagao no desempenho na prova 
compartilhada pela ansiedade pre-prova sejam 
as mesmas das variancias compartilhadas pelo 
tempo de revisao. 

A parte 3 do diagrama mostra a figura 
completa. A primeira coisa a ser notada e que 
os quadros (ou caixas) representando ansieda¬ 
de pre-prova e o tempo de revisao tem uma 
grande sobreposigao (eles dividem 50% da 
variagao). Mais importante, quando olhamos 
quanto o tempo de revisao e a ansiedade con- 
tribuem para o desempenho na prova, vemos 
que existe uma porgao do desempenho na 
prova que e compartilhada por ambos, ansie¬ 
dade e tempo de revisao (a area pontilhada). 
Entretanto, ainda existem pequenas partes da 
variancia no desempenho na prova que sao 
linicas para as outras duas variaveis. Assim, 
embora na parte 1 a ansiedade pre-prova com¬ 
partilha um pedago grande da variagao com o 
desempenho na prova, alguma dessa sobrepo¬ 
sigao e tambem compartilhada com o tempo de 
revisao. Se removermos o pedago da variancia 
que e tambem dividida pelo tempo de revi¬ 
sao, teremos uma medida do relacionamento 
unico entre desempenho na prova e ansiedade 
pre-prova. Nos usamos correlagoes parciais 
para descobrir o tamanho do pedago unico 
da variancia. Portanto, podemos determi- 
nar uma correlagao parcial entre ansiedade 
pre-prova e desempenho na prova enquan- 
to “controlamos” o efeito do tempo de re¬ 
visao. Da mesma forma, podemos determinar 
uma correlagao parcial entre o tempo de revi¬ 
sao e o desempenho na prova “controlando” 
os efeitos da ansiedade pre-prova. 

4.6.2 Correlagao parcial utilizando o 
SPSS© 

Para determinar uma correlagao parcial 
com os dados do desempenho na prova, selecio- 
ne a opgao Correlate (Correlacionar) do menu 
Analyze (Analisar) e, entao, selecione Partial 
(Parcial) ( Analyze=>Correlate=>Partial) 
(Analisar=>Correlacionar=>Parcial...) e uma 
caixa de dialogo semelhante a da Figura 4.18 
sera ativada. Essa caixa de dialogo lista todas 
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Figura 4.17 Diagrama mostrando os principios da correlagao parcial. 
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Figura 4.18 Caixa de dialogo principal para 
determinagao de uma correlagao parcial. 

as variaveis do editor de dados no lado esquer- 
do deixando dois espacos vazios no lado direi- 
to. O primeiro espago e para listar as variaveis 
que voce quer correlacionar e o segundo e para 
indicar quais variaveis voce quer controlar. No 
exemplo que descrevi, queremos determinar 
o efeito unico da ansiedade pre-prova no de- 
sempenho na prova e, assim, queremos corre¬ 
lacionar as variaveis exam (prova) e anxiety 
(ansiedade), enquanto controlamos o tempo 
de revisao. A Figura 4.18 mostra a caixa de 
dialogos completa. Se voce clicar em Oc “ om 
(Opgoes) outra caixa de dialogo aparece como 
mostra a Figura 4.19. 

Essas opgoes sao similares aquelas da cor¬ 
relagao bivariada exceto que voce pode esco- 
lher mostrar correlagdes de ordem zero. Cor- 
relagoes de ordem zero sao os coeficientes de 
correlagao bivariada sem controle de quaisquer 
outras variaveis (isto e, sao o coeficiente de cor¬ 
relagao de Pearson). Assim, em nosso exemplo, 



Figura 4.19 Opgoes para correlagao parcial. 


se selecionarmos as correlagdes de ordem zero, 
o SPSS ira produzir uma matriz de correlagdes 
entre anxiety, exam, e revise (ansiedade, prova 
e revisao). Se voce nao determinou as correla¬ 
gdes bivariadas antes das correlagdes parciais, 
essa e uma maneira util de comparar correla¬ 
gdes que nao foram controladas com as que fo- 
ram. Essa comparagao da a voce uma percep- 
gao da contribuigao das diferentes variaveis. 
Marque a caixa das correlagdes de ordem zero, 
mas deixe o restante das opgoes como estao. 

A saida 4.6 do SPSS mostra os resultados 
para a correlagao parcial da ansiedade pre-pro- 
va e o desempenho na prova controlada pela 
variavel tempo de revisao. A primeira coisa 
a notar e a matriz das correlagdes de ordem 
zero que foi obtida porque utilizamos a caixa 
de dialogos options (opgoes). As correlagdes 
mostradas aqui sao identicas aquelas obtidas 
com o procedimento da correlagao de Pearson 
(compare essa matriz com a da saida 4.2 do 
SPSS). Abaixo das correlagdes de ordem zero 
esta a matriz de correlagdes para as variaveis 
anxiety e exam (ansiedade e prova), mas con¬ 
trolada pela variavel revisao. Por ora contro¬ 
lamos uma unica variavel, assim, obtivemos 
o que e conhecido como uma correlagao par¬ 
cial de primeira ordem. E possivel controlar 
os efeitos de duas variaveis ao mesmo tempo 
(uma correlagao parcial de segunda ordem) ou 
controlar tres variaveis (uma correlagao parcial 
de terceira ordem) e assim por diante. Em pri¬ 
meiro lugar, note que a correlagao parcial entre 
desempenho na prova e ansiedade pre-prova e 
de —0,2467, que e consideravelmente menor 
do que a correlagao quando o tempo de revisao 
nao e controlado por (r = —0,4410). Na ver- 
dade, o coeficiente de correlagao e aproxima- 
damente menor do que ele era antes. Embora 
essa correlagao seja estatisticamente significa- 
tiva (seu valor p esta abaixo de 0,05) o relacio- 
namento diminuiu. Em termos de variancia, o 
valor de R 2 para a correlagao parcial e de 0,06, 
o que significa que a ansiedade pre-prova pode 
agora contribuir com somente 6% da variancia 
no desempenho na prova. Quando os efeitos 
do tempo de revisao nao eram controlados, a 
ansiedade pre-prova compartilhava 19,4% da 
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Saida 4.6 Saida para uma correlagao parcial 

PARTIAL CORRELATION 

COEFFICIENTS 

(COEFICIENTES DE CORRELACAO 

PARCIAIS) 

Zero Order Partials 

(Parciais de 

ordem zero) 



EXAME 

ANXIETY REVISE 



(Prova) 

(Ansiedade) (Revisar) 


EXAME (Prova) 

1.0000 

-.4410 .3967 



( o) 

( 101) ( 101) 



p = . 

P = 000 P = 000 


ANXIETY (Ansiedade) 

-.4410 

1.0000 -.7092 



( 101) 

( 0) ( 101) 



P = .000 

P = . P = .000 


REVISE (Revisar) 

.3967 

-.7092 1.0000 



( 101) 

( 101) ( 0) 



P = .000 

P = .000 P = . 


(Coeficientes / D.F 

) / 1-tailed 

significance) 


(Coeficientes / G.L 

/ Significancia unilateral) 


PARTIAL CORRELATION 

COEFFICIENTS 

(COEFICIENTES DE CORRELACAO 

PARCIAIS) 

Controling for .. (Controle por 

.) REVISE(REVISAR) 



EXAME 

ANXIETY 



(Prova) 

(Ansiedade) 


EXAME (Prova) 

1.0000 

- .2467 



( 0) 

( 100) 



p = . 

P = .006 


ANXIETY (Ansiedade) 

-.2467 

1.0000 



( 100) 

( 0) 



P = .006 

p = . 


(Coeficientes / D.F 

) / 1-tailed 

significance) 


(Coeficientes / G.L 

/ Significancia unilateral) 


". "is printed if a 

coefficient cannot be computed 


(Se um coeficiente nao puder ser 

calculado entao " . "e impresso) 


variancia com os escores da prova e, assim, a 
inclusao do tempo de revisao diminuiu o mon- 
tante da variagao nos escores da prova compar- 
tilhados com a ansiedade. Dessa maneira, uma 


medida mais verdadeira do papel da ansiedade 
pre-prova foi obtida. A execugao dessas ana- 
lises tem mostrado que apenas a ansiedade 
pre-prova nao explica muito da variancia nos 
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escores da prova e descobrimos um relacio- 
namento complexo entre ansiedade e revisao 
que poderia de outra maneira ter sido ignora- 
do. Embora a causalidade ainda nao seja certa, 
porque variaveis relevantes foram inclufdas, o 
problema da terceira variavel e, pelo menos, 
tratado de alguma forma. 

Essas correlacoes parciais podem ser fei- 
tas quando as variaveis sao dicotomicas. As- 
sim, usando um exemplo anterior, procuramos 
um relacionamento entre o tamanho do cere- 
bro e o genera (que e dicotomico) controlado 
pelo tamanho do corpo. E, tambem, bom que 
a “terceira” variavel seja dicotomica, assim, 
por exemplo, podemos determinar o relacio¬ 
namento entre uma bexiga frouxa e um grande 
numero de tarantulas subindo nas suas pernas 
(ambas variaveis contfnuas) controladas pelo 
genera (uma variavel dicotomica). 4 


4.6.3 Correlagoes semiparciais (ou por 
parte) © 

No proximo capftulo des- 
cobriremos outra forma de cor- 
relagao conhecida como corre- 
lagao semiparcial (tambem 
chamada de correlagao por 
parte). E valido explicar as diferengas entre 
esse tipo de correlagao e a correlagao semipar¬ 
cial. Quando fazemos a correlagao parcial 



4 Esses dois exemplos sao, de fato, casos simples de 
regressao hierarquica (veja o proximo capftulo) e o 
primeiro e, tambem, um exemplo de analise de cova- 
riancia. Isso pode parecer confuso agora, mas, a me- 
dida que progredirmos no livro, espero que fique claro 
que todas as estatfsticas que voce utiliza sao, de fato, a 
mesma coisa, mas com roupas e nomes diferentes. 


entre duas variaveis, controlamos o efeito 
da terceira variavel. Especificamente, o efei¬ 
to que a terceira variavel tem em ambas as 
variaveis na eorrelacao e controlada. Numa 
eorrelacao semiparcial, controlamos o efeito 
que a terceira variavel tem em somente uma 
das variaveis envolvidas na eorrelacao. A 

Figura 4.20 ilustra esse prinefpio para os dados 
do desempenho na prova. A eorrelacao parcial 
que calculamos leva em consideragao nao so¬ 
mente o efeito da revisao no desempenho na 
prova, mas tambem o efeito da revisao na va¬ 
riavel ansiedade. Se fossemos calcular a corre¬ 
lagao semiparcial para os mesmos dados, terf- 
amos controle apenas sobre o efeito da revisao 
no desempenho na prova (o efeito da revisao 
na ansiedade pre-prova seria ignorado). Corre- 
lagoes parciais sao mais uteis para observar o 
relacionamento unico entre duas variaveis 
onde outras variaveis foram descartadas. Cor¬ 
relacoes semiparciais sao, portanto, uteis quan¬ 
do tentamos explicar a variancia numa variavel 
particular (uma safda) a partir de um conjunto 
de varaveis previsoras. Esse sera assunto do 
Capftulo 5. 

4.7 COMO RELATAR COEFICIENTES DE 
CORRELAQAO © 

Relatar coeficientes de eorrelacao e mui- 
to facil: voce apenas deve dizer quao grande 
eles sao e quais sao os valores das significan- 
cias (embora o valor de significancia nao seja 
tao importante porque o coeficiente de corre- 
lacao e ele proprio um tamanho de efeito!). 
As quatro coisas a serem observadas sao: (1) 
nao deve ter zero na frente do ponto decimal 


Revisao 



Exame 


\ 

Ansiedade 


Revisao 

✓ 

Exame Ansiedade 


Correlagao parcial Correlagao semi-parcial 

Figura 4.20 A diferenga entre uma correlagao parcial e uma semiparcial. 
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para o coeficiente de correlacao ou valor de 
probabilidade (porque nenhum deles deve 
ser maior que 1)*; (2) se voce estiver citando 
uma probabilidade unilateral, deve dize-lo; (3) 
cada coeficiente de correlacao e representado 
por uma letra diferente (e algumas delas sao 
gregas!); (4) existe um criterio padrao de pro- 
babilidades que usamos (0,05, 0,01 e 0,001). 
Vamos pegar alguns exemplos deste capftulo: 

/ Havia um relacionamento significante en- 

tre o ntimero de comerciais assistidos e os 
pacotes de balas comprados, r = 0,87, p 
(unilateral) < 0,05. 

/ O desempenho na prova estava correla- 
cionado significativamente com a ansie- 
dade pre-pro va r = —0,44 e o tempo gasto 
revisando, r = 0,40; o tempo gasto revi- 
sando tambem foi correlacionado com a 
ansiedade pre-prova, r = —0,71 (todos os 
ps < 0,001). 

/ Havia um relacionamento positivo entre 
os conceitos estatfsticos de uma pessoa e 
seu conceito no GCSE de matematica, r s 
= 0,46, p < 0,05. 

/ Havia um relacionamento positivo entre 
os conceitos estatfsticos de uma pessoa e 
seu conceito no GCSE de matematica, r= 
0,35, p < 0,05. (Observe que eu usei o tau 
de Kendall aqui.) 

/ O genero do gato estava correlacionado 
significativamente com o tempo que o gato 
passava fora de casa, r pb = 0,38, p < 0,01. 

Um ponto final a ser observado e que nas 
ciencias sociais nos temos varios nfveis padrao 
de significancia estatfstica. O criterio mais im- 
portante e que o valor da significancia e menor 
do que 0,05; entretanto, o valor exato da signi¬ 
ficancia e muito mais baixo, entao podemos ter 
mais certeza do poder do efeito experimental. 
Nessas circunstancias, ficamos contentes que 
o nosso resultado nao seja apenas significante 
em 0,05, mas tambem significante a um nfvel 

muito mais baixo (eba!). Os valores que usa- 


* N. de T.: Esse tipo de diferen§a nao e feita no Brasil. To- 
dos os valores, independentemente de poderem ou nao 
ultrapassar um, sao representados com o zero inicial. 


mos sao 0,05, 0,01, 0,001 e 0,0001. Voce rara- 

mente sera capaz de relatar um efeito que seja 

significante a um nfvel menor do que 0,0001! 

4.8 0QUEDESC0BRIM0SS0BRE 
ESTATISTICA? © 

Este capltulo abordou diferentes maneiras 
de estudar os relacionamentos entre variaveis. 
Iniciamos verificando como medir estatisti- 
camente os relacionamentos desenvolvendo o 
que ja sabemos sobre variancia (do Capltulo 
1) e depois aprendemos a olhar a variancia 
compartilhada entre variaveis. Essa variancia 
compartilhada e conhecida como covaridncia. 
Apos, vimos como representar graficamente os 
relacionamentos usando o diagrama de disper- 
sdo. Na sua forma mais simples, esses graficos 
tracam valores de uma variavel contra outra. 
Entretanto, voce pode tracar mais do que duas 
variaveis num diagrama de dispersao em 3D ou 
sobrepor um diagrama de dispersao. E possfvel 
tambem distinguir grupos de pessoas num dia¬ 
grama de dispersao usando sfmbolos diferen¬ 
tes e cores. Descobrimos, entao, que quando 
os dados sao parametricos, podemos mensurar 

a forga do relacionamento usando o coeficien¬ 

te de correlacao r de Pearson. Quando os da¬ 
dos violam as suposicdes dos testes parame¬ 
tricos podemos usar o r s de Spearman ou, para 
pequenos conjuntos de dados, o r de Kendall 
pode ser mais preciso. Vimos, tambem, que as 

correlagoes podem ser calculadas entre duas 

variaveis quando uma delas e dicotomica (isto 

e, formada por apenas duas categorias); quan¬ 

do as categorias nao tem uma continuidade 
subjacente, usamos a correlacao bisserial por 

ponto r pb mas quando as categorias tem uma 
continuidade subjacente, utilizamos a correla- 

gao bisserial r b . Finalmente, verificamos as di- 
ferencas entre correlagdes parciais, nas quais 

o relacionamento entre duas variaveis e medi- 

do controlando o efeito que uma ou mais varia¬ 

veis tem em ambas as variaveis, e correlagdes 
semiparciais, nas quais o relacionamento entre 

duas variaveis e medido controlado pelo efei¬ 

to que uma ou mais variaveis tem em somente 
uma das variaveis. 
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4.9 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• Correlagao bisserial 

• Correlagao bivariada 

• Coeficiente de determinacao 

• Covariancia 

• Desvios dos produtos cruzados 

• Tau de Kendall 

• Padronizagao 

• Correlagao parcial 

• Coeficiente de correlagao de Pearson 

• Correlagao bisserial por ponto 

• Diagrama de dispersao 

• Correlagao semiparcial 

• Coeficiente de correlagao de Spearman 


no artigo (essay). Ele tambem traduziu es- 
sas notas na sua classificagao de notas 
(grade): primeira, segunda superior, se- 
gunda inferior e terceira classe. Usando os 
dados no arquivo EssayMarks.sav, des- 
cubra qual foi o relacionamento entre o 
tempo gasto escrevendo o artigo e a nota 
final em termos de percentagem e classifi¬ 
cagao das notas (trace um diagrama de 
dispersao tambem!). © 

• Usando os dados do ChickFick.sav do 
Capitulo 3, existe um relacionamento en¬ 
tre genero e excitagao? Usando os mes- 
mos dados, existe um relacionamento en¬ 
tre o filme assistido e excitagao? © 


4.10 TAREFAS DO ALEX ESPERTO 


As respostas para essas tarefas podem ser 
encontradas no site www.artmed.com.br no 
arquivo Answers-(Chapter 4).pdf. 

Um estudante estava interessa- 
do em saber se havia um rela¬ 
cionamento positivo entre o 
tempo gasto escrevendo um ar¬ 
tigo e a nota recebida. Ele pe- 
gou 45 dos seus amigos e contou quantas 
horas eles gastavam escrevendo seu artigo 
(hours) e a percentagem que eles tiveram 



4.10 LEITURAS COMPLEMENTARES 

HOWELL, D. C. Statistical Methods 

forPsychology. Belmont (CA): Duxbury, 

2002 (5 a edigao). O Capitulo 9 fornece uma 
cobertura mais detalhada sobre correlagao e 
regressao do que Wright, mas a leitura nao e 
tao facil. O Capitulo 10 e otimo para correlagao 
bisserial e bisserial por ponto. 

WRIGHT, D. B. First Steps in Statistics. 

Londres: Sage, 2002. Esse livro apresenta 
uma introdugao muito clara aos conceitos de 
correlagao e regressao (Capitulo 8). 



REGRESSAO 


5.1 0 QUE VOCE VAI APRENDER NESTE 
CAPITULO? © 

No ultimo capftulo vimos como medir (e 
tracar) relacionamentos entre duas variaveis. 
Podemos avail 9 ar um passo nesse processo e 
aprender como prever uma das variaveis em 
fungao da outra. Um exemplo simples eode 
tentar prever os nfveis de estresse a partir do 
tempo que falta ate a ocorrencia de uma pa¬ 
lestra. Voce esperaria que esse fosse um rela- 
cionamento negativo (quanto menor o tempo 
ate a palestra, maior a ansiedade). Podemos 
estender esse relacionamento basico para res¬ 
ponder a questoes como “se faltam 10 minu- 
tos ate que alguem precise falar a um publico, 
quao ansioso ele estara?”. Essa e a essencia 
da analise de regressao: e uma forma de pre¬ 

ver algum tipo de safda (resultado) a partir 
de uma ou mais variaveis previsoras. Este 

capftulo aborda a analise de regressao com 
profundidade. Comedo apresentando alguns 
princfpios basicos utilizando o exemplo de 
prever um resultado a partir de um unico pre¬ 
visor (regressao simples). Em seguida, ex- 
plicarei o que e um modelo, como estima-lo, 
como podemos determinar o quao bem ele se 
ajusta aos dados, como tudo isso e feito no 
SPSS e como as safdas do SPSS sao interpre- 


tadas. Depois, analiso o caso mais complexo 
de quando um resultado e previsto a partir de 
diversas variaveis previsoras (regressao mul- 
tipla). Embora eu nao aborde como o mode¬ 
lo e estimado, irei descreve-lo e especificar 
varios metodos que selecionaram as variaveis 
que farao parte do modelo. Veremos, ainda, 
algumas coisas que podem afetar a precisao 
do modelo e como trata-las antes de reali- 
zar a analise no SPSS, interpretar a safda e 
descobrir quao bem o modelo se ajusta aos 
dados e como ele pode ser generalizado. Se 
voce ainda esta acordado, o capftulo termina 
verificando como podemos incorporar varia¬ 
veis categoricas na analise de regressao uti¬ 
lizando algo chamado de variaveis auxiliares 
(dummy). Ufa! 

5.2 UMA INTRODUQAO A 
REGRESSAO © 

A correlacao pode ser uma ferramenta de 
pesquisa bastante util, mas ela nada nos infor¬ 
ma sobre o poder preditivo das variaveis. Na 
analise de regressao, ajustamos um modelo 
preditivo aos nossos dados e entao usamos esse 
modelo para prever valores da variavel depen- 
dente (VD) a partir de uma ou mais variaveis 
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independentes (Vis). 1 A regressao simples pro- 
cura prever uma variavel de saida a partir de 
um unica variavel previsora, enquanto que a 
regressao multipla busca prever um resultado 
a partir de diversas variaveis previsoras. Essa 
e uma ferramenta bastante util porque nos per- 
mite ir um passo alem dos dados que de fato 
temos. Na Segao 1.4.11, apresentarei a ideia de 
que podemos prever qualquer valor utilizando 
a seguinte equagao generica: 

Saida, = (Modelo,) + Erro, (5.1) 

Isso significa apenas 
que a saida ou resposta que 
estamos tentando prever 
para uma determinada pes- 
soa pode ser prevista por 
qualquer modelo que ajus- 
tarmos aos dados mais al- 
gum tipo de erro. Na re¬ 
gressao, o modelo que 
ajustamos e linear (“mode- 
“modelo baseado em uma 
linha reta”) e voce pode imaginar que esta ten¬ 
tando resumir um conjunto de dados com uma 
linha reta (lembre a Figura 1.11). Assim, a pala- 
vra “modelo” na equagao acima pode ser subs- 
tituida por algo que defina a linha que ajusta¬ 
mos aos dados (veja a proxima segao). 

Com qualquer conjunto de dados existem 
varias linhas que podem ser utilizadas para re¬ 
sumir a tendencia geral e, desse modo, preci- 
samos encontrar uma forma de decidir entre as 
muitas possibilidades. Para que seja possivel 
tirar conclusoes precisas, e necessario ajus- 
tar o melhor modelo que descreve os dados. 
Existem muitas maneiras de ajustar uma linha 


1 Infelizmente, voce encontrara pessoas (e o SPSS tam- 
bem) se referindo as variaveis na regressao como de- 
pendentes e independentes (como em experimentos 
controlados). No entanto, a pesquisa correlacional por 
sua natureza raramente controla as variaveis indepen¬ 
dentes para medir o efeito na variavel dependente. Em 
vez disso, as variaveis sao mensuradas simultaneamente 
e sem um controle restrito. Assim, nao e correto falar 
das variaveis de regressao dessa forma. Por esse motivo, 
denomino as “variaveis independentes” como previso- 
res e a “variavel dependente” como saida ou resultado. 


reta aos dados que foram coletados. A mais 
simples e utilizar seus olhos para imaginar 
uma linha que parega resumir bem os dados. 
Entretanto, esse metodo e bastante subjetivo 
e nao assegura que o modelo e o melhor que 
se poderia ter escolhido. Portanto, vamos uti- 
lizar tecnicas matematicas para determinar a 
linha que melhor descreve os dados observa- 
dos. Esse metodo e denominado metodo dos 
minimos quadrados. 

5.2.1 Algumas informacoes importantes 
sobre retas © 

Mencionei acima que a palavra modelo 
na equagao geral seria substitufda por “algu- 
ma coisa que define a linha que se ajusta aos 
dados”. De fato, qualquer linha reta pode ser 
definida por duas coisas: (1) a inclinagao (ou 
gradiente) da linha (normalmente representa- 
do por /;,). e (2) o ponto em que a linha cruza 
o eixo vertical do grafico (conhecido como 
intercepto da linha b 0 ). De fato, nosso modelo 
geral se torna a equagao (5.2) na qual Y i e a 
variavel de saida que queremos prever e A, e 
o escore do i-esimo participante da variavel 
previsora. 2 O gradiente da linha reta ajustada 
aos dados e b l e b„ e o intercepto da linha. Os 
parametros b t e b 0 sao conhecidos como coe- 
ficientes de regressao e aparecerao de vez em 
quando no livro, onde voce ira ve-los normal¬ 
mente representados como b (sem qualquer 
subscrito) ou b ; (que significa b associado a 
variavel i ). Existe um termo resfduo, e p que 
representa a diferenga entre o valor previsto 
pela linha para o participante i e o escore que 
o participante i realmente obteve. A equagao e 
muitas vezes apresentada sem esse termo resi- 
duo (assim, ignore-o se ele estiver lhe incomo- 


2 As vezes, voce ira ver essa equagao escrita como: 

Y i = (Po + AA) + 

A unica diferencja e que nessa equagao aparece /i em vez 
de b e, de fato, as duas versoes sao a mesma coisa - 
elas apenas utilizam letras diferentes para representar 
os coeficientes. Eu prefiro a notacao-/S (e a utilizei na 
edicao anterior); no entanto, quando o SPSS esdma os 
coeficientes nessa equagao, ele as rotula como b. Para 
ser consistente com a saida do SPSS que voce vera, 
utilizarei b em vez de ft. 



lo linear” significa 
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dando); no entanto, vale a pena saber que esse 
termo significa que o nosso modelo nao ira se 
ajustar perfeitamente aos dados coletados: 

Y t = ( b 0 + bjX,) + e, (5.2) 

Uma linha particular tem um gradiente e 
um intercepto especfficos. A Figura 5.1 mostra 
um conjunto de linhas que apresentam o mes- 
mo intercepto, mas diferentes gradientes e ou- 
tro conjunto que tem o mesmo gradiente (in- 
clinagao), mas diferentes interceptos. A Figura 
5.1 tambem ilustra outro ponto importante: o 
de que o gradiente da linha nos informa algo 
sobre a natureza do relacionamento sendo des- 
crito. No Capitulo 4, vimos que uma relagao 
pode ser tanto positiva quanto negativa (e com 
isso nao quero dizer que e a diferenga entre 
se dar bem com a sua namorada ou discutir 
o tempo todo!). Uma linha que apresenta um 
gradiente positivo descreve um relacionamento 
positivo, ao passo que uma com um gradiente 
negativo descreve um relacionamento negati- 
vo. Assim, se voce olhar para os graficos na 
Figura 5.1 em que os gradientes diferem, mas 
os interceptos sao os mesmos, notara que a li- 
nha mais grossa descreve um relacionamento 
positivo e a mais fina, um negativo. 

Se e possivel descrever uma linha conhe- 
cendo somente o gradiente (inclinagao) e o 
intercepto dessa linha, entao podemos utili- 
zar esses valores para descrever o nosso mo¬ 
delo (porque no modelo de regressao linear 
utilizamos uma linha reta). Assim, e possivel 


imaginar o modelo que ajustamos aos nossos 
dados na regressao linear como uma linha reta 
que pode ser descrita matematicamente pela 
cquacao (5.2). Com a regressao lutamos para 
encontrar a linha que melhor descreve os da¬ 
dos coletados, entao estimamos o gradiente e 
o intercepto de tal linha. Tendo definido esses 
valores, podemos inserir diferentes valores na 
nossa variavel previsora no modelo para esti- 
mar os valores da variavel resposta (de saida). 

5.2.2 0 metodo dos mniintos 
quadrados © 

Ja mencionei que o metodo dos minimos 
quadrados e uma forma de encontrar a linha 
que melhor se ajusta aos dados (isto e, encon¬ 
trar a linha que passe entre - ou o mais proxi¬ 
mo possivel - o maior numero de pontos de 
dados). Essa “linha de melhor ajuste ou ade- 
rencia” e encontrada ao verificarmos qual linha 
e a melhor de todas as possiveis que poderiam 
ser tragadas e resulta na menor diferenga entre 
os pontos observados e a linha. A Figura 5.2 
mostra que quando qualquer linha e ajustada 
a um conjunto de dados, existira uma pequena 
diferenga entre os valores previstos pela linha 
e os dados que foram efetivamente observa¬ 
dos. Estamos interessados na diferenga vertical 
entre a linha e os dados reais porque estamos 
utilizando a linha para prever valores de uma 
variavel Y a partir de uma variavel X. Embo- 
ra alguns pontos de dados estejam exatamente 
sobre a linha, outros estao acima ou abaixo. 



Mesmo intercepto com 
diferentes inclinagoes 



Mesma inclinagao com 
diferentes interceptos 


Figura 5.1 Linhas com os mesmos gradientes, mas com diferentes interceptos e linhas com o 
mesmo intercepto, mas com gradientes (inclinagoes) diferentes. 





Descobrindo a Estatistica Usaimdo o SPSS 159 



Figura 5.2 Esse grafico mostra um diagrama de dispersao de alguns dados com uma linha de 
tendencia entre eles. As linhas verticals (pontilhadas) representam as diferengas (residuos) entre 
a tendencia e os dados. 


indicando que existe uma diferenga entre o 
modelo que se ajusta aos dados e os dados co- 
letados. Algumas dessas diferengas sao positi- 
vas (os pontos estao acima da linha, indicando 
que o modelo esta subestimando seus valores) 
e algumas sao negativas (os pontos estao abai- 
xo da linha, indicando que o modelo esta supe- 
restimando seus valores). Essas diferengas sao 
geralmente denominadas residuos. Na discus- 
sao sobre variancia na Segao 1.4.1, expliquei 
que se somarmos as diferengas positivas e 
negativas, elas tendem a se cancelar resultado 
numa soma zero. Para evitar esse problema, 
elevamos as diferengas ao quadrado antes de 
soma-las. As diferengas ao quadrado fornecem 
uma medida de quao bem uma determinada 
linha se ajusta aos dados: se as diferengas ao 
quadrado sao grandes, a linha nao e represen- 
tativa dos dados; se as diferengas ao quadrado 
sao pequenas, a linha e representativa. A soma 
das diferengas ao quadrado (ou SS abreviado) 
pode ser calculada para qualquer linha que 
e ajustada a dados; a qualidade de ajuste de 
cada linha aos dados pode ser avaliado pela 
soma das diferengas ao quadrado. O metodo 
dos mmimos quadrados seleciona a linha que 


apresenta a menor soma das diferengas ao qua¬ 
drado (assim, ele escolhe a linha que melhor 
representa os dados observados). Uma forma 
de selecionar essa linha otima seria ajustar 
cada linha possfvel ao conjunto de dados, cal- 
cular a soma das diferengas ao quadrado para 
cada uma e entao escolher a linha que apre- 
sentasse o menor valor para essa soma. Voce 
certamente gastaria um bom tempo fazendo 
isso! Felizmente, existe uma tecnica matema- 
tica para encontrar maximos e mmimos e essa 
tecnica (calculo) e utilizada para encontrar a 
linha que minimiza a soma das diferengas ao 
quadrado. O resultado final e que os valores do 
intercepto e da inclinagao da “linha de melhor 
aderencia” podem ser estimados. Cientistas 
sociais geralmente se referem a essa linha de 
melhor ajuste como linha de regressao. 

5.2.3 Avaliando o ajuste: soma dos 
quadrados, R e ff 2 ® 

Uma vez que encontramos a linha de me¬ 
lhor ajuste, e importante que avaliemos o quao 
bem ela adere aos dados (ou seja, a qualidade 
do ajuste do modelo). Fazemos isso porque 
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embora essa linha seja a 
melhor disponfvel, ela ain- 
da podera ter um pessimo 
ajuste aos dados! Na Se- 
gao 1.4.1, vimos que uma 
medida de adequagao de 
um modelo e a soma dos 
quadrados das diferengas 
(ou mais comumente ava- 
liamos o modelo utilizando a equagao (5.3)). 
Se quisermos avaliar a linha de melhor ade¬ 
rencia, precisamos compara-la com algo e o 
que escolhemos e o modelo mais basico que 
podemos ter. Assim, vamos utilizar a equagao 
(5.3) para calcular o ajuste do modelo mais ba¬ 
sico e entao o ajuste do melhor modelo (a linha 
de melhor aderencia); se o melhor modelo for 
bom, ele deve aderir aos dados bem melhor de 
que o modelo basico. Isso e um tanto abstrato, 
portanto, vamos ver um exemplo: 

Desvios = y~\observados - modelo) 2 (5,3) 


Imagine que eu quero prever a quantidade 
de discos vendidos ( Y) a partir do investimen- 
to feito em publicidade (X). Um dia meu chefe 
vai ate o meu escritorio e diz “Andy, quantos 
discos iremos vender se gastarmos £100 000 
em publicidade?”. Se eu nao tivesse um bom 
modelo do relacionamento entre a venda de 
discos e publicidade, qual seria o meu melhor 
palpite? Bem, provavelmente a melhor respos- 
ta que eu poderia dar seria o numero medio de 
discos vendidos (digamos, 200.000) porque 
na media e o quanto de discos esperamos ven¬ 
der. Essa resposta talvez satisfaga um executi¬ 
ve fonografico sem cerebro. No entanto, o que 
voce diria se ele tivesse perguntado: “Quantos 
discos seriam vendidos se gastassemos £1 em 
publicidade?”. Novamente, na ausencia de 
uma informagao mais precisa, o melhor pal¬ 
pite seria fornecer o numero medio de discos 
vendidos (200.000). Aqui ha um problema: 
nao importa a quantidade investida em publi¬ 
cidade, sempre vou prever a mesma quantida¬ 
de de vendas. Deve ficar bem claro, entao, que 
a media e praticamente inutil como modelo de 
relacionamento entre duas variaveis, mas ele e 
o modelo mais simples disponfvel. 


Assim, como estrategia basica para prever 
um resultado, podemos considerar a escolha 
da media, porque em media ela sera um bom 
palpite para um determinado resultado. Uti¬ 
lizando a media como um modelo, podemos 
calcular diferengas entre os valores observa- 
dos e os valores previstos pela media (equagao 
(5.3)). Vimos na Segao 1.4.1 que elevamos to- 
das essas diferengas ao quadrado para obter- 
mos a soma das diferengas ao quadrado. Essa 
soma e conhecida como soma total dos qua¬ 
drados (representada por SS T ) porque ela e a 
quantia total de diferengas presentes quando o 
modelo mais basico e aplicado aos dados. Esse 
valor representa o quao boa a media e como 
um modelo para os dados observados. Ago¬ 
ra se ajustarmos um modelo mais sofisticado 
aos dados, como a linha de melhor aderencia, 
podemos novamente obter as diferengas entre 
esse novo modelo e os dados observados, uti¬ 
lizando mais uma vez a equagao (5.3). Na se¬ 
gao anterior vimos que o metodo dos mfnimos 
quadrados encontra a melhor linha possfvel 
para descrever o conjunto de dados minimi- 
zando as diferengas entre o modelo ajustado 
aos dados e os proprios dados. Entretanto, 
mesmo com esse modelo otimo ainda vai exis- 
tir alguma falta de aderencia que sera repre¬ 
sentada pelas diferengas entre cada ponto de 
dados observado e o valor previsto pela linha 
de regressao. Como antes, essas diferengas sao 
elevadas ao quadrado antes de serem somadas 
de modo que as diregoes das diferengas nao se 
cancelem. O resultado e conhecido como soma 
dos resfduos ao quadrado ou soma dos qua¬ 
drados residual (SS R ). Esse valor representa 
o grau de imprecisao quando o melhor modelo 
e ajustado aos dados. Podemos utilizar esses 
dois valores para comparar o quanto melhor e 
a linha de regressao (linha do melhor ajuste) 
que o valor que seria obtido utilizando a media 
como modelo (isto e, quao melhor e o nosso 
modelo otimo quando confrontado com o pior 
modelo). A melhoria na previsao resultante da 
utilizagao da linha de regressao em vez da me¬ 
dia e obtida calculando a diferenga entre SS T 
e SS R . Essa diferenga nos mostra a redugao na 
imprecisao do modelo resultante do ajuste do 
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modelo da linha de regressao aos dados. Essa 
melhoria e a soma dos quadrados do mode¬ 
lo (SS M ). A Figura 5.3 mostra cada soma dos 
quadrados graficamente. 

Se o valor do SS M e alto, usar o modelo 
de regressao e bem diferente do que utilizar 
a media para prever o valor da variavel resul- 
tante. Isso implica que o modelo de regressao 
apresenta uma grande melhoria em quao bem 
os valores resultantes podem ser previstos. 
No entanto, se o SS M e pequeno, entao utili¬ 
zar o modelo de regressao e apenas um pouco 


melhor do que usar a media (ou seja, o mode¬ 
lo de regressao nao e muito melhor do que o 
nosso melhor palpite). Uma medida util que 
se pode obter das somas dos quadrados e a 
proporgao de melhoria debitada ao nosso mo¬ 
delo. Isso e facilmente calculado dividindo a 
soma dos quadrados para o modelo pela soma 
total dos quadrados. O valor obtido e denomi- 
nado R 2 e ele e um percentual. Entao, R 2 re- 
presenta a quantidade de variancia nas saldas 
explicadas pelo modelo (SS M ) relativa a quan¬ 
ta variacao foi inicialmente explicada (SS T ). 





SS M utiliza as diferengas entre 
o valor medio de / 
e a linha de regressao. 


Figura 5.3 Diagrama mostrando de onde e derivada a soma dos quadrados da regressao. 
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Dessa forma, ele representa o percentual de 
variagao nos valores previstos que podem ser 
explicados pelo modelo: 

(5.4) 

SS T 

Nao por coincidencia, esse valor e o mes- 
mo que encontramos para R 2 no Capftulo 4 
(Secao 4.5.3) e voce notara que ele e interpre- 
tado da mesma forma. Portanto, na regressao 
simples podemos tomar a raiz quadrada do seu 
valor para obter o coeficiente de correlagao de 
Pearson. Como tal, o coeficiente de correlagao 
nos fornece uma boa estimativa da aderencia 
do modelo de regressao e R 2 nos da uma boa 
medida do valor desse relacionamento. 

Uma segunda utilizagao das somas dos 
quadrados para avaliar o modelo e por meio do 
teste F. Abordaremos esse teste em profundi- 
dade no Capftulo 8, mas, brevemente, o teste 
F tem por base a razao de melhoria devida ao 
modelo (SS M ) e a difcrenca entre o modelo e 
os dados observados (SS R ). De fato, em vez 
de utilizar a soma dos quadrados, tomamos a 
media dessas somas (denominadas quadrados 
medios ou MS). Para obter a media da soma 
dos quadrados e necessario dividir pelos graus 
de liberdade (isso e semelhante a calcular a va- 
riancia a partir da soma dos quadrados - veja a 
Secao 1.4.1). Para o SS M o grau de liberdade e 
simplesmente o numero de variaveis no mode¬ 
lo, e para o SS R ele e o numero de observacoes 
menos o numero de parametros sendo esti- 
mados (isto e, o numero de coeficientes beta 
incluindo a constante). O resultado e a media 
dos quadrados para o modelo (MS m ) e a media 
dos quadrados dos resfduos (MS R ). Nesse esta- 
gio nao e essencial que voce entenda como as 
medias dos quadrados sao derivadas (isso sera 
explicado no Capftulo 8). Entretanto, e impor- 
tante que voce entenda que a razao F (equagao 
5.5) e uma medida do quanto o modelo melho- 
rou na previsao de valores comparado com o 
nfvel de nao precisao do modelo: 


Se o modelo e bom, entao esperamos que 
a melhoria na previsao devida ao modelo seja 
grande (assim, MS m sera grande) e a dife- 
renga entre o modelo e os dados observados 
serao pequenas (assim, MS R sera pequeno). 
Resumindo, um bom modelo devera ter uma 
razao F grande (maior do que 1 pelo menos) 
porque o numerador da equagao (5.5) sera 
maior do que o denominador. A magnitude 
exata da razao F pode ser calculado utilizan- 
do valores crfticos para os graus de liberda¬ 
de correspondentes (como exemplificado no 
Apendice A.3). 

5.2.4 Interpretando previsoes 
individuals (!) 

Vimos que o previsor em um modelo de 
regressao tem um coeficiente (£>,), que na 
regressao simples representa o gradiente da 
linha de regressao. O valor de b { representa 
a mudanga na safda resultante da mudanga 
de uma unidade no previsor. Se o modelo 
for inutil para previsao, entao se o valor do 
previsor mudar, o que se podera esperar da 
mudanga no valor de safda? Bern, se o mo¬ 
delo e muito ruim, esperamos que essa alte- 
ragao nao ocorra, isto e, seja zero. Relembre 
da Figura 5.3 (veja o quadro representando 
SS T ) na qual vimos que utilizar a media nao 
era a melhor forma de prever um resultado. 
De fato, a linha representando a media e ho¬ 
rizontal, o que significa que a medida que a 
variavel previsora muda, o valor previsto nao 
se altera (porque para cada nfvel da variavel 
previsora, prevemos que o valor de safda sera 
o valor da media). O ponto importante aqui 
e que modelos ruins (como a media) terao 
um coeficiente de regressao igual a zero. Um 
coeficiente de regressao igual a zero signi¬ 
fica: (1) a mudanga de unidade na variavel 
previsora nao resultara em uma alteragao no 
valor previsto (o valor previsto nao muda de 
qualquer forma) e (2) o gradiente da linha de 
regressao e zero, assim, a linha de regressao 
sera horizontal. A conseqiiencia logica e que 
se uma variavel preve significativamente um 
valor de safda, entao ela deve ter um valor 
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b significativamente diferente de zero. Essa 
hipotese e testada utilizando o teste t (veja o 
Capftulo 7). A estatistica t testa a hipotese 
nula de que o valor de b e zero: dessa forma, 
se for significativo aceitamos a hipotese que 
o valor de b e significativamente diferente de 
zero e que a variavel previsora contribui sig- 
nificamente para a nossa habilidade de esti- 
mar o valor de safda. 

Nosso problema em testar se o valor de b 
e diferente de zero e que ele depende da uni- 
dade de medida. Dessa forma, o teste t 6 cal- 
culado levando em conta o erro padrao. O erro 
padrao nos informa algo sobre como seria o 
comportamento dos valores b se fossem toma- 
das muitas amostras relativas a vendas de dis¬ 
cos e investimento em publicidade e o valor de 
b fosse calculado para cada uma das amostras. 
Poderfamos fazer um diagrama da distribuigao 
de freqiiencias dos valores b dessas amostras 
para descobrir se eles seriam semelhantes ou 
bem diferentes (lembre a Segao 1.6). Pode- 
mos utilizar o desvio padrao dessa distribui- 
cao (conhecido como erro padrao ) como uma 
medida da semelhanca dos valores b entre as 
amostras. Se o erro padrao e pequeno, signifi- 
ca que muitas amostras provavelmente tem va¬ 
lores b similares ao que foi obtido na amostra 
coletada (porque a variagao entre as amostras 
e pequena). O teste t nos informa se o valor 
b e diferente de zero relativo a variagao dos 
valores b para amostras de mesmo tamanho. 
Quando o erro padrao e pequeno, mesmo pe- 
quenos desvios de zero podem refletir uma di- 
ferenga significativa porque b e representativo 
da maioria das possfveis amostras. 

A equagao (5.6) mostra como o teste 1 
e calculado e voce ira encontrar uma versao 
geral dessa equagao no Capftulo 7 (equagao 
(7.1)). O ^sperado e simplesmente o valor de b 
que esperarfamos obter se a hipotese nula fos¬ 
se verdadeira. Mencionei antes que a hipotese 
nula e de que b e zero, assim, esse valor pode 
ser substitufdo por zero.* A equagao torna-se 


* N. de T.: Em geral, a hipotese nula e de que o coefi- 
ciente angular e zero, mas nao necessariamente. 


o valor observado de b dividido pelo erro pa¬ 
drao com qual ele esta associado: 3 

^_ (^observado ^esperado) 

SE, 


Os valores de t seguem uma distribuigao 
especial que diferem de acordo com um para- 
metro denominado grau de liberdade. Na re- 
gressao, o grau de liberdade e simplesmente 
N - p - 1, onde N e o tamanho da amostra 
epeo numero de previsores. Na regressao 
simples, quando existe apenas um previsor, 
o grau de liberdade passa a ser N - 2. Ten- 
do determinado que a distribuigao t precisa 
ser utilizada, o valor observado de t pode ser 
comparado com valores que se esperaria ob¬ 
ter apenas por acaso: se t e muito grande, e 
improvavel que ele tenha ocorrido por aca¬ 
so (esses valores podem ser encontrados no 
Apendice A.2). O SPSS fornece a probabili- 
dade exata de que o valor de t tenha ocorrido 
por acaso se o valor de b fosse de fato zero. 
Como regra geral, se esse valor (significan- 
cia) for menor do que 0,05 ou 5%, os cientis- 
tas sociais concordam que b e significativa¬ 
mente diferente de zero; ou seja, o previsor 
contribui de forma significativa para o valor 
da safda (veja o Capftulo 1). 


3 Para comprovar isso voce pode utilizar os valores da 
salda 5.3 do SPSS abaixo a fim de calcular t para a 
constante (intercepto) (t = 134,140/7,537 = 17,79) e 
investimento em publicidade (gradiente). Para o inves¬ 
timento em publicidade, voce ira obter um valor de t 
diferente se utilizar os valores como os apresentados 
na saida do SPSS. Isso ocorre porque o SPPS arredon- 
da os valores para 3 casas decimals nas tabelas, mas 
calcula o valor t sem arredondar esses valores (normal- 
mente isso nao acarreta diferenqas substanciais, mas 
nesse caso sim!). Para obter os valores nao-arredonda- 
dos, clique duas vezes na tabela da salda do SPSS e 
entao de um duplo clique no valor que voce quer ver 
sem arredondamento. Voce deve encontrar que t = 
0,096124/0,009632 = 9,979. 
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5.3 EXECUTANDO REGRESSAO SIMPLES 
NO SPSS © 

Ate agora, vimos um pouco da base teo- 
rica da regressao, embora restrita a casos em 
que existe apenas um previsor. Para auxiliar 
a esclarecer o que ja aprendemos, iremos 
apresentar um exemplo de regressao simples 
utilizando o SPSS. Anteriormente, pedi que 
voce imaginasse que eu trabalhava para uma 
gravadora e que meu chefe estava interessado 
em prever a venda de discos a partir da publi- 
cidade. Existem alguns dados para esse exem¬ 
plo no arquivo Recordl.sav. Esse arquivo de 
dados tem 200 linhas, cada uma representan- 
do um disco diferente. Existem tambem duas 
colunas, uma representando as vendas de cada 
disco na semana apos o langamento e outra 
representando a quantidade (em libras) gasta 
em promover o disco antes do seu lancamen- 


to. Esse e o formato para a entrada de dados 
de regressao: a variavel de safda e a previso- 
ra devem estar em colunas diferentes e cada 
linha deve representar valores independentes 
dessas duas variaveis. O padrao desses dados 
e mostrado na Figura 5.4 e deve ficar claro 
que existe um relacionamento positivo: assim, 
quanto mais dinheiro for gasto na promogao 
de um disco, mais ele deve vender. E claro 
que alguns discos vendem bem a despeito do 
que for gasto em publicidade (canto superior 
esquerdo do diagrama), mas nao existe um 
que venda muito mal quando muito dinheiro 
e gasto em publicidade (canto inferior direito 
do diagrama). O diagrama tambem mostra a 
linha de melhor aderencia para esses dados: 
tendo em mente que a media e representada 
por uma linha horizontal em torno do valor de 
vendas de 200 000, a linha de regressao e visi- 
velmente diferente. 


Previsores da venda semanal de discos 



Orgamento de publicidade (em libras) 

Figura 5.4 Diagrama de dispersao mostrando o relacionamento entre a venda de discos e a 
quantia gasta para promover o disco. 
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Figura 5.5 Caixa de dialogo principal para a regressao. 


Para encontrar os parametros que des- 
crevem a linha de regressao e para ver se 
essa linha e um modelo util, precisamos 
executar uma analise de regressao. Para fa- 
zer a analise, voce precisa acessar a caixa 
de dialogos principal utilizando o caminho 
Analyzes Regressions Linear... (Anali- 
sar=>Regressao=>Linear...). A Figura 5.5 
mostra a caixa de dialogo resultante. Existe um 
espago denominado Dependent (Dependente) 
no qual voce deve colocar a variavel de saida 
(nesse exemplo, Sales (Vendas)). Assim, sele- 
cione sales (vendas) da lista no lado esq uerdo 
e transfira para o espago clicando em _U. Exis¬ 
te outro espago rotulado de Independent(s) (In- 
dependentes) no qual cada variavel previsora 
deve ser colocada. Na regressao simples, uti- 
lizamos uma linica variavel previsora, (nesse 
exemplo, adverts Ipublicidade]) entao voce 
deve selecionar adverts da lista clicando em 
_Ll de modo a transferi-la para a lista dos pre- 
visores. Existe uma variedade de opgoes dis- 
ponfveis, mas elas serao exploradas dentro do 
contexto da regressao multipla (veja a Segao 
5.5). Por enquanto, clique em <* para execu¬ 
tar a analise. 


5.4 INTERPRETANDO A REGRESSAO 
SIMPLES © 

5.4.1 Ajuste global do modelo © 

A primeira tabela fornecida pelo SPSS e 
um resumo do modelo. Essa tabela de resu¬ 
mo (Saida do SPSS 5.1) fornece os valores do 
R e do R 2 para o modelo que foi calculado. 
Para esses dados, R tem um valor de 0,578, 
e porque existe apenas um previsor, esse va¬ 
lor representa a correlagao simples entre o 
valor investido em publicidade e a venda de 
discos (voce pode confirmar isso executando 
uma correlagao utilizando o que foi visto no 
Capftulo 4). O valor de R 2 6 0,335, o que nos 
informa que o gasto em publicidade pode ex- 

Saida 5.1 do SPSS 


Model Summary (Resumo do modelo) 


Model 

(Modelo) 

R 

R 2 

Adjusted R 
Square (R 
quadrado 
ajustado) 

Standard Error 
of the Estimate 
(Erro padrao da 
estimativa) 

i 

0.578 s 

0.335 

0.331 

65.9914 


a. (Previsores: (constante), Orgamento de publicidade 
(milhares de libras) 
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plicar 33,5% da variagao das vendas de dis¬ 
co. Em outras palavras, se voce esta tentando 
explicar porque alguns discos vendem mais 
do que outros, podemos olhar a variagao das 
vendas de discos diferentes. Devem existir 
muitos fatores que podem explicar essa varia¬ 
gao, mas nosso modelo, que inclui somente a 
quantia gasta com publicidade, pode explicar 
33% deles. Isso significa que 66% da variagao 
das vendas nao pode ser explicada apenas pela 
publicidade. Portanto, deve haver outras varia- 
veis que tambem tem influencia. 

A proxima parte da safda relata uma ana- 
lise de variancia (ANOVA - veja o Capftulo 
8). A tabela de resumo mostra as varias somas 
dos quadrados descritas na Figura 5.3 e os 
graus de liberdade associados com cada uma 
(Safda 5.2 do SPSS). A partir desses dois va- 
lores, a soma dos quadrados media pode ser 
calculada dividindo as somas dos quadrados 
pelo grau de liberdade associado. A parte mais 
importante da tabela e a razao F, que e calcu¬ 
lada utilizando a equacao (5.5) e a significan- 
cia associada a esse valor F. Para esses dados, 
F e 99,59, que e significativo ao nfvel de p < 
0,001 (porque o valor na coluna denominada 
Sig. e menor do que 0,001). Esse resultado nos 
informa que existe uma probabilidade menor 
do que 0,1% de que um valor F tao alto tenha 
ocorrido apenas por acaso. Desta forma, po- 
de-se concluir que nosso modelo de regressao 
resulta em previsoes melhores das vendas de 


disco do que se utilizassemos o valor medio 
das vendas. Resumindo, o modelo de regres¬ 
sao preve as vendas de disco bastante bem. 

5.4.2 Parametros do modelo 0 

A ANOVA nos in¬ 
forma se o modelo, em 
geral, resulta em um grau 
de previsao significativa- 
mente bom dos valores 
da variavel de safda. No 
entanto, a ANOVA nao 
nos informa sobre a con- 
tribuigao individual das variaveis no modelo 
(embora neste caso simples exista uma unica 
variavel no modelo e, assim, podemos inferir 
que esta variavel e um bom previsor). A tabe¬ 
la na safda 5.3 do SPSS fornece detalhes dos 
parametros do modelo (os valores beta) e da 
significancia desses valores. Vimos na equa- 
gao (5.2) que b 0 e o intercepto y (ponto onde 
a linha corta o eixo Y) e esse e o valor B (na 
safda do SPSS) para a constante (intercep¬ 
to). Assim, da tabela, podemos dizer que b 0 
e 134,14 e isso significa que quando nenhum 
dinheiro for aplicado em publicidade (quan¬ 
do X = 0), o modelo preve que 134 140 dis¬ 
cos serao vendidos (lembre que a unidade de 
medida das vendas e em milhares de discos). 
Tambem podemos ler o valor de b, da tabela e 
esse valor representa a gradiente (inclinagao) 



Safda 5.2 do SPSS 
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Saida 5.3 do SPSS 


Coeficients a (Coeficientes) 



Unstandardized 
Coefficients (Coeficientes 
nao-padronizados) 

Standardized 
Coefficients (Coeficientes 
padronizados) 



Model (Modelo) 

B 

Std. Error 
(Erro Padrao) 

Beta 

t 

Sig. 

1 (Constant) Advertising Budget 
(thousands of pounds) 

134.140 

7.537 


17.799 

0.000 

(Constante) (Milhares de libras) 
(Investimento em Publiciade) 

9.612E-02 

0.010 

0.578 

9.979 

0.000 


a.Variavel dependente: vendas de discos (em milhares). 


da linha de regressao. Ele e 9,612E-02, que 
e a expressao em notacao cientifica do valor 
0,09612. 4 Embora esse valor seja a inclinagao 
da linha de regressao, e mais util pensar nele 
como representando a mudanga da variavel 
de sai'da para cada alteragao de uma unidade 
no previsor. Dessa forma, se a nossa variavel 
previsora e aumentada de uma unidade (se o 
orgamento de publicidade aumenta 1), nosso 
modelo preve que 0,096 discos adicionais se- 
rao vendidos. Como a unidade de medida esta 
em milhares de libras e milhares de discos 
vendidos, pode-se dizer que para um aumen- 
to de £1000 em publicidade, o modelo preve 
96 (0,096x1000 = 96) discos extras vendi¬ 
dos. Como voce pode imaginar, e um pessimo 
investimento para a gravadora: eles investem 
£1000 e vendem apenas 96 discos a mais! Fe- 
lizmente, como ja sabemos, a quantia investi- 
da em publicidade representa apenas um tergo 
das vendas de discos! 


4 Voce pode ter percebido que esse valor e apresentado 
pelo SPSS como 9.612E-02 e muitos estudantes acham 
essa notacao confusa. Bern, essa notacao significa sim- 
plesmente 9,61 x 10 1 (que podera ser uma notacao um 
pouco mais familiar). Ok, alguns de voces continuant 
confusos. Entao pense no E-02 como se significasse 
“mova o ponto decimal duas casas para a esquerda”, 
assim, 9.612E-02 torna-se 0,09612. Se o numero fosse 
9.612E-01, ele seria 0,9612 e se fosse 9,612E-03, se- 
ria 0,009612. Da mesma forma, leia o E+02 (note que 
o sinal de menos mudou) como “mova a vfrgula duas 
casas para a dircita". Assim, 9,612E+02 e a represen- 
ta$ao cienti'fica de 961,2. 


Vimos anteriormente que, em geral, o 
valor do coeficiente de regressao b represen¬ 
ta a mudanga na saida resultante da variagao 
de uma unidade na variavel de entrada. Se 
essa variavel previsora esta tendo um impac- 
to significativo na nossa habilidade de prever 
um resultado, esse b deve ser diferente de 0 
(e grande comparado ao erro padrao). Vimos 
ainda que o teste t nos informa se o valor b 
e diferente de 0. O SPSS fornece a probabi- 
lidade exata de que o valor de t ocorra se o 
valor de b e zero. Como regra geral, se essa 
significancia observada e menor do que 0,05, 
os cientistas sociais concordam que o resulta¬ 
do reflete um efeito genuino (veja o Capitulo 
1). Para esses dois valores, as probabilidades 
sao 0,000 (zero ate a terceira decima) e, des¬ 
sa forma, podemos dizer que a probabilidade 
de que esses valores t ocorram se os valores b 
sao zero e menor do que 0,001. Assim, os bs 
sao diferentes de 0 e podemos concluir que o 
investimento em publicidade tem uma contri- 
buigao significativa (p < 0,001) para prever o 
valor das vendas de disco. 

5.4.3 Utilizando o modelo CD 

Ate agora descobrimos que temos um mo¬ 
delo util, um que melhora significativamente 
nossa habilidade de prever a venda de discos. 
No entanto, o proximo estagio e usar o modelo 
para fazer algumas previsoes. O primeiro esta¬ 
gio e definir o modelo substituindo os valores 
b na equagao (5.2) com os valores da saida 5.3 
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do SPSS. Alem disso, podemos substituir o X 
e o Y com os nomes das variaveis, assim, o 
modelo torna-se: 

Vendas de b 0 + ^Investimento em 
discos, — Publicidade,- 

= 134,14+ (0,09612 x 
Investimento em 
Publicidade,) (5.7) 

Agora e possivel fazer uma previsao sobre 
a venda de discos substituindo o valor da pu¬ 
blicidade com o valor de interesse. Por exem- 
plo, imagine que um executivo de uma grava- 
dora queira gastar £100.000 em publicidade 
em um disco a ser langado. Lembrando que as 
nossas unidades ja estao em milhares de libras, 
voce pode simplesmente substituir o valor da 
publicidade por 100. Ele ira, entao, descobrir 
que a venda de discos deve ficar em torno de 
144.000 para a primeira semana de vendas: 

Vendas de _ 134,14 + (0,09612 x 
discos, — Investimento em Publicidade,) 

= 134,14+ (0,09612 x 100) 

= 143,75 (5.8) 

5.5 REGRESSAO MULTIPLA: 0 BASIC0 © 

Para resumir o que 
apreendemos ate agora, 
na regressao linear 
simples a variavel de 
saida Y e prevista utili- 
zando uma equagao de 
uma linha (equagao 
(5.2)). Supondo que 
foram coletados varios 
valores das variaveis X 
e Y, os parametros desconhecidos da equagao 
podem entao ser determinados. Eles sao cal- 
culados pelo ajuste do modelo aos dados (nes- 
se caso, uma linha reta) para o qual a soma das 
diferengas ao quadrado entre os valores sobre 
a linha e os dados originais e minimizada. 
Esse metodo e denominado metodo dos mini- 
mos quadrados. A regressao multipla e uma 
extensao logica desses princfpios para a situa- 


gao em que existem varios previsores. Nova- 
mente, ainda utilizamos a equagao basica: 

Saida, = (Modelo,) + Erro, 

Desta vez o modelo e um pouco mais 
complicado. Ele e basicamente o mesmo da re¬ 
gressao simples, exceto que para cada previsor 
extra que for incluido, um coeficiente e adicio- 
nado; assim, cada variavel previsora tern seu 
proprio coeficiente e a variavel de saida e pre¬ 
vista a partir de uma combinagao de todas as 
variaveis multiplicadas pelos seus respectivos 
coeficientes mais o (intercepto). (Veja a equa¬ 
gao (5.9).) Os parenteses nao sao necessarios, 
eles servem apenas para fazer uma analogia 
com a equagao geral: 

Y t = (b 0 + + b 2 X 2 + ... + bJQ + £, (5.9) 

Yea variavel de saida (resultado), bj e o 
coeficiente do primeiro previsor (A!), b ; eo 
coeficiente do segundo previsor (X 2 ), b n e o 
coeficiente do n-esimo previsor (Xj e e t e a 
diferenga entre o valor previsto e o observado 
de Y para o i-esimo participante. Neste caso, 
o modelo ajustado e mais complicado, mas os 
principios basicos sao os mesmos da regres¬ 
sao simples. Isto e, procuramos encontrar uma 
combinagao linear de previsores que se corre- 
lacionam de forma maxima com a variavel de 
saida. Assim, quando nos referirmos ao mo¬ 
delo de regressao multipla, estaremos falando 
sobre um modelo na forma da equagao (5.9). 

5.5.1 Um exemplo de um modelo de 
regressao multipla © 

Imagine que o nosso executivo da grava- 
dora esta interessado em ampliar o modelo da 
venda de discos incorporando uma nova varia¬ 
vel. Ja sabemos que a publicidade e responsa- 
vel por 33% da variagao das vendas de discos, 
mas um valor bem maior (67%) permanece nao 
explicado. O executivo pode avaliar um novo 
previsor para o modelo numa tentativa de justi- 
ficar algumas das variagoes nao explicadas na 
venda de discos. Ele decide medir o numero de 
vezes que o disco e tocado na radio 1 (Estagao 
Nacional de Radio Britanica) durante a semana 
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anterior ao langamento. O modelo existente que 
foi derivado utilizando o SPSS (veja a equagao 
(5.7)) pode agora ser entendido para incluir 
essa nova variavel (airplay - execugoes): 

Venda de _ b 0 +fc 1 Publicidade + 
discos,- 7> 2 Execugoes, + s t (5.10) 

O novo modelo e baseado na equagao 
(5.9) e inclui valores b para os dois previso- 
res (e, e claro, a constante). Se calcularmos 
os valores b, podemos fazer previsoes sobre a 
venda de discos nao apenas utilizando a quan- 
tidade investida em publicidade, mas tambem 
em termos de execugoes do disco na radio. 
Existem somente dois previsores no modelo e, 
assim, ele pode ser apresentado graficamente 
em tres dimensoes (Figura 5.6). 

A equagao (5.9) descreve o trapezio escu- 
recido no diagrama (conhecido como o piano 


de regressao), e os pontos destacados represen- 
tam os pontos de dados observados. Como na 
regressao simples, o piano ajustado aos dados 
pretende ser o melhor posslvel para esses da¬ 
dos. No entanto, existem invariavelmente algu- 
mas diferengas entre o modelo e os dados da 
vida real (esse fato e evidente porque alguns 
dos pontos nao residem exatamente sobre a area 
escurecida do grafico). O valor b para a publici¬ 
dade descreve a inclinagao de cima para baixo 
do piano de regressao enquanto que o valor b 
para a execugao ( airplay ) fornece a inclinagao 
da esquerda para a direita do piano de regres¬ 
sao. Conhecer esses dois valores permite que 
coloquemos o piano de regressao no espago. 

E bastante simples visualizar o modelo de 
regressao com dois previsores utilizando urn 
diagrama de dispersao tridimensional. Entre- 
tanto, a regressao multipla pode ser utilizada 
com tres, quatro ou mesmo mais variaveis. 



Figura 5.6 Diagrama de dispersao do relacionamento entre vendas de discos, investimento em 
publicidade e numero de execugoes do disco no radio. 
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Embora voce nao possa imediatamente visua- 
lizar como tal modelo complexo se parece, ou 
o que os valores b representam, voce deve ser 
capaz de aplicar os princfpios desses modelos 
basicos a cenarios mais complexos. 

5.5.2 Soma dos quadrados, R e R 2 © 

Quando temos varios previsores, a parti- 
gao da soma dos quadrados e a mesma que foi 
executada para uma unica variavel exceto que o 
modelo que estamos nos referindo toma a for¬ 
ma da equacao (5.9) em vez de simplesmente 
ser uma linha reta bidimensional. Portanto, um 
SS T pode ser calculado e representar a diferen- 
5 a entre os valores observados e a media dos 
valores da variavel resultado. O SS R ainda re- 
presenta a difcrenqa entre os valores previstos 
de Y pelo modelo e os valores observados de 
Y. Finalmente, SS M pode ainda ser calculado 
e representa a dilerenca entre os valores de Y 
previstos pelo modelo e o valor da media. Em¬ 
bora o calculo desses valores seja muito mais 
complicado que na regressao simples, concei- 
tualmente esses valores sao os mesmos. 

Quando existem varios previsores, nao faz 
sentido olhar para os coeficientes de correlacao 
simples e, neste caso, o SPSS produz um coe- 
ficiente de correlagao multiplo (denominado R 
Multiplo). O R Multiplo e a correlacao entre 
os valores observados de Y e os de Y previstos 
pelo modelo de regressao multipla. Desta for¬ 
ma, valores grandes do R Multiplo representam 
uma alta correlacao entre os valores previstos 
e observados da variavel de safda. Um R Mul¬ 
tiplo igual a 1 representa a situacao na qual o 
modelo prediz com perfeicao os valores obser¬ 
vados, isto e, ele adere perfeitamente a todos os 
pontos. Como tal, o R Multiplo e uma medida 
de quao bem o modelo preve os dados observa¬ 
dos. Segue que o R 2 resultante pode ser inter- 
pretado da mesma forma que na regressao sim¬ 
ples: ele e a quantidade de vari actio na variavel 
de safda que pode ser creditada ao modelo. 

5.5.3 Metodos de regressao © 

Se voce esta interessado em construir 
um modelo complexo com varios previsores, 


como decidimos que previsores utilizar? Mui¬ 
to cuidado deve ser tornado ao selecionarmos 
previsores para um modelo porque os valores 
dos coeficientes de regressao dependem das 
variaveis utilizadas no modelo. Desta forma, 
os previsores inclufdos e a forma que eles 
sao colocados podem ter um grande impacto. 
Num mundo ideal, previsores deveriam ser se- 
lecionados baseados em pesquisas anteriores . 5 
Se novos previsores estao sendo adicionados 
a modelos existentes, selecione aquelas novas 
variaveis com base na importancia teorica 
substantiva de tais variaveis. Voce nao deve de 
forma alguma selecionar centenas de previso¬ 
res ao acaso, junta-los todos em uma analise 
de regressao e torcer pelo melhor. Alem do 
problema da seleqao de previsores, existem 
varias formas de entrada das variaveis no mo¬ 
delo. Quando os previsores sao todos com- 
pletamente nao correlacionados, a ordem de 
entrada das variaveis tem pouco efeito nos pa- 
rametros calculados; no entanto, nas pesquisas 
em ciencias sociais raramente temos previso¬ 
res nao-correlacionados, assim, o metodo de 
se lectio dos previsores e crucial. 

5.5.3.1 Hierarquico (Entrada em blocos) © 

Na regressao hierarquica, os previsores 
sao selecionados com base em trabalhos an¬ 
teriores e o pesquisador decide em que ordem 
eles devern ser colocados no modelo. Como 
regra geral, previsores conhecidos (de outras 
analises) devem ser colocados no modelo 
primeiro pela sua ordem de importancia em 
poder prever a variavel de safda. Depois de 
entrar com todos os previsores conhecidos, o 
pesquisador pode adicionar os novos ao mo¬ 
delo. Novas variaveis podem ser colocadas de 
uma unica vez, passo a passo ou hierarquica- 


5 Eu, um tanto cinicamente, apresento essa sugestao pro- 
pondo que os previsores sejam escolhidos com base em 
pesquisas anteriores que tenham utilizado uma boa me- 
todologia. Se voce basear tais decisoes nas analises de 
regressao, selecione previsores baseados somente em 
pesquisas passadas que utilizaram a regressao de forma 
apropriada e com modelos confiaveis e generalizaveis! 
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mente (de modo que o novo previsor que se 
julga mais importante entre primeiro). 

5.5.3.2 Entrada forgada © 

Entrada forgada (ou Enter, como e conhe- 
cida no SPSS) e um metodo em que todos os 
previsores sao forgados no modelo ao mesmo 
tempo. Da mesma forma que a hierarquica, 
este metodo baseia-se em boas razoes teori- 
cas para incluir os previsores escolhidos, mas 
diferentemente da hierarquica, o pesquisador 
nao toma decisoes sobre a ordem que as varia- 
veis sao acrescentadas. 

5.5.3.3 Metodos por passos (Stepwise) © 

Na regressao passo a passo, as decisdes 
sobre a ordem em que os previsores sao acres- 
centados ao modelo e baseada puramente em 
criterios matematicos. No metodo forward 
(para frente), um modelo inicial contendo so- 
mente a constante (b 0 ) e definido. O computa- 
dor entao procura pelo previsor (entre as va- 
riaveis possfveis) que melhor preve a variavel 
de safda - ele faz isso selecionando o previsor 
que apresenta o coeficiente de correlagao sim¬ 
ples mais alto com a variavel de safda. Se esse 
previsor aumenta significativamente a habili- 
dade do modelo prever a safda, ele e mantido 
no modelo e o computador procura por um se- 
gundo previsor. O criterio para selecionar esse 
segundo previsor e procurar pela variavel que 
apresenta a maior correlagao semiparcial com 
a variavel de safda. Deixe-me explicar isso de 
outra forma. Imagine que o primeiro previsor 
pode explicar 40% da variagao da variavel de 
safda; portanto, existe ainda 60% nao explica- 
da. O computador procura pelo previsor que 
pode explicar a mais alta taxa dos 60% restan- 
tes (assim, ele nao esta interessado nos 40% 
que ja foram explicados). Em termos estatfsti- 
cos, voce pode pensar isso como uma correla¬ 
gao parcial na qual o computador correlaciona 
cada um dos previsores com a safda enquanto 
controla o efeito do primeiro previsor. A ra- 
zao para chama-la de correlagao semiparcial 
e porque o efeito do primeiro previsor e par- 
cializado apenas entre os previsores restantes 


e nao sao controlados na variavel de safda. A 
correlagao semiparcial fornece uma medida 
de quanto a “nova variancia” na safda pode ser 
explicada por cada um dos previsores restan¬ 
tes (veja a Segao 4.6). O previsor que contri- 
bui mais para a nova variancia e adicionado ao 
modelo, e se ele tiver uma contribuigao signi- 
ficativa para o poder preditivo do modelo ele e 
mantido e outro previsor e procurado. 

O metodo passo a passo ( stepwise ) do 
SPSS e o mesmo que o metodo forward (para 
frente), exceto que a cada vez que um previsor 
e adicionado a equagao, um teste de remogao 
e feito sobre o previsor menos util. Para tal 
a equagao de regressao esta constantemente 
sendo reacessada para ver se algum previsor 
redundante pode ser removido. O metodo para 
tras ( backward ) e o oposto do metodo para 
frente (forward), ja que o computador inicia 
colocando todos os previsores no modelo e 
entao calcula a contribuigao de cada um ve- 
rificando a significancia do teste t de cada 
previsor. O valor da significancia e compara- 
do com um criterio de remogao (que pode ser 
tanto o valor absoluto de uma estatistica teste 
quanto o valor da probabilidade da ocorrencia 
dessa estatistica teste). Se o previsor satisfaz 
o criterio de remogao (isto e, se ele nao esta 
fazendo uma contribuigao estatisticamente 
significativa para o quao bem o modelo preve 
a variavel resultado) ele e removido do mode¬ 
lo e o modelo e reestimado com os previsores 
restantes. A contribuigao dos demais previso¬ 
res e entao reavaliada. 

Se voce decidir utilizar o metodo pas¬ 
so a passo (stepwise), o metodo para tras 
(backward) e preferfvel ao metodo para frente 
(forward). Isso ocorre em virtude dos efeitos 
supressores, que acontecem quando um previ¬ 
sor tern um efeito significativo, mas somente 
quando outra variavel e mantida constante. A 
selegao para frente (forward) tem uma proba¬ 
bilidade maior do que a para tras (backward) 
de excluir previsores envolvidos em efeitos 
supressores. Assim, com o metodo para frente 
(forward) ha um risco maior de cometermos 
erro do Tipo II (isto e, eliminar um previsor 
que de fato contribui para o modelo). 
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5.5.3.4 Escolhendo um metodo 


Que metodo 
de regressao 
devo usar? 



O SPSS permite que 
voce opte por qualquer 
um desses metodos e e 
importante selecionar o 
mais apropriado. Os me¬ 
todos para frente, para 
tras e passo a passo 
( forward , backward e 
stepwise) aparecem to- 
dos sob o titulo geral de metodos passo a 
passo (stepwise methods ) porque em todos 
eles o computador escolhe as variaveis com 
base em um criterio matematico. Muitos es- 
critores argumentam que isso tira das maos 
do pesquisador decisoes metodologicas im- 
portantes. E mais, os modelos utilizados 
pelo computador freqiientemente tiram van- 
tagem da variaqao da amostragem aleatoria 
e, assim, decisoes sobre que variaveis devem 
ser incluidas serao baseadas em pequenas 
diferencas nas correlates semiparciais. En- 
tretanto, essas pequenas diferengas estatisti- 
cas podem contrastar dramaticamente com a 
importancia teorica do previsor para o mo- 
delo. Por essa razao, e melhor evitar os me¬ 
todos passo a passo ( stepwise ) exceto em 
uma analise exploratoria do modelo (ver 
Wright, 1997, p. 181). Quando existe uma 
forte literatura teorica disponivel, tome por 
base o que as pesquisas anteriores aponta- 
ram. Inclua qualquer variavel significativa 
no modelo pela sua ordem de importancia. 
Apos essa analise inicial, repita a regressao, 
mas exclua qualquer variavel que for estatis- 
ticamente redundante na primeira vez. Exis¬ 
tent consideragoes importantes na decisao 
de quais previsores incluir. E importante nao 
incluir muitos previsores. Como regra geral, 
quanto menos, melhor e certamente inclua 
somente previsores para os quais voce tenha 
razoes teoricas solidas. Assim, seja seletivo 
e lembre que voce deve ter um tamanho de 
amostra decente (alguns sugerem pelo me¬ 
nos 15 participantes por previsor - veja a 
Segao 5.6.2.3) 


5.6 QUAO ACURADO E 0 MEU MODELO 
DE REGRESSAO? © 

Quando produzi- 
mos um modelo ba- 
seado em uma amostra 
dos dados existem duas 
questoes importantes a 
serem feitas: (1) o mo¬ 
delo representa bem os 
dados, ou ele e influen- 
ciado por um pequeno numero de casos e (2) o 
meu modelo pode ser generalizado para outras 
amostras? E fundamental fazer essas ques¬ 
toes porque elas irao afetar como utilizaremos 
o modelo que esta sendo construido. Essas 
questoes sao tambem, em certo sentido, hie- 
rarquicas, pois nos nao queremos generalizar 
um modelo mini. No entanto, e um erro pensar 
que se um modelo adere bem aos dados pode- 
mos tirar conclusoes alem da nossa amostra. 
Generaliza^ao e um passo adicional critico; 
se acharmos que o nosso modelo nao e genera- 
lizavel, devemos restringir qualquer conclusao 
baseada no modelo da amostra utilizada. Pri- 
meiro vamos analisar como determinamos se 
um modelo e uma representagao acurada dos 
dados reais e depois, na se^ao 5.6.2, verifica- 
remos como e possivel avaliar se um modelo 
pode ser usado para fazer inferencias alem da 
amostra dos dados que foi coletada. 

5.6.1 Interpretando o modelo de 
regressao I: diagnostics © 

Para responder a questao de quao bem o 
modelo adere aos dados observados ou se ele 
e influenciado por um pequeno numero de ca¬ 
sos, podemos buscar valores atipicos ( outliers ) 
ou casos influenciadores (a diferenca e expli- 
cada no quadro 5.1). Veremos isso em etapas. 

5.6.1.1 Valores atipicos ( outliers ) e 
residuos © 

Um valor atipico e um caso que difere 
substancialmente da maioria dos dados (veja 
o Quadro 3.1). A Figura 5.7 mostra um exem- 
plo de tal caso na regressao. Valores atipicos 
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Figura 5.7 Grafico demonstrando o feito de um valor atipico. A linha pontilhada representa a 
linha de regressao original para esses dados (veja a Figura 5.2),e a linha cheia representa a linha de 
regressao quando um valor atipico esta presente. 


podem introduzir tendenciosidade no modelo, 
pois eles irao afetar os valores dos coeficientes 
de regressao estimados. Por exemplo, a Figu¬ 
ra 5.7 utiliza os mesmos dados da Figura 5.2, 
exceto que o escore de um participante foi al- 
terado para ser um valor atipico (nesse caso, 
uma pessoa que ficou extremamente calma na 
presenga de uma aranha muito grande). A mu- 
dan ga desse unico valor teve um efeito drama- 
tico no modelo de regressao escolhido. Com o 
valor atipico presente, o modelo de regressao 
muda: a inclinagao (gradiente) e reduzida (a li¬ 
nha se torna mais horizontal) e o intercepto au- 
menta (a linha cortara o eixo Y num ponto mais 
alto). Deve hear claro a partir desse diagrama 
que e importante tentar detectar os valores ati- 
picos para ver se o modelo e tendencioso. 

Como voce acha que poderia detectar um 
valor atipico? Sabemos que um valor atipico, 
pela sua natureza, e muito diferente de todos 
os demais escores. Assim, voce acha que o 
modelo ira prever os escores dessas pessoas 
de forma acurada? Obviamente, a resposta e 
nao: olhando para a Figura 5.7 e evidente que 
mesmo que o valor atipico tenha distorcido o 


modelo ele ainda preve esse valor so que de 
uma forma muito ruim (a linha de regressao 
esta bem longe dele). Portanto, se formos cal- 
cular as diferengas entre os valores dos dados 
coletados e os valores previstos pelo modelo, 
podemos detectar os valores atipicos buscan- 
do as diferengas grandes. Esse processo e o 
mesmo que procurar por casos em que o mo¬ 
delo nao preve de forma precisa. As diferen- 
gas entre os valores previstos pelo modelo e 
os valores observados na amostra sao conhe- 
cidos como residuos. Esses residuos represen- 
tam o erro que esta presente no modelo. Se o 
modelo se ajusta bem aos dados da amostra, 
todos os residuos devem ser pequenos (se o 
modelo aderir perfeitamente aos dados, todos 
os pontos estarao sobre a linha de regressao 
e todos os residuos serao iguais a zero). Se o 
modelo nao tiver uma boa aderencia aos dados 
da amostra, os residuos serao grandes. Alem 
disso, se qualquer caso destacar-se por ter um 
grande residuo, ele podera ser atipico. 

Os residuos normals ou nao-padroniza- 
dos descritos acima sao mensurados na mes- 
ma unidade da variavel de saida e, portanto, 
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sao diffceis de interpretar entre modelos. O 
que podemos fazer e procurar resfduos que 
se destacam por serem particularmente gran- 
des. Para resolver esse problema, utilizamos 
resfduos padronizados, que sao resfduos 
divididos por uma estimativa do seu desvio 
padrao. Ja apresentamos o processo de padro- 
nizacao na Segao 1.4.1 como uma forma de 
converter variaveis em unidades padroes de 
medida (o desvio padrao); tambem lidamos 
com os escores-z (veja o Quadro 3.2), em que 
variaveis sao convertidas em unidades de des- 
vios padrao (isto e, elas sao convertidas em 
escores que sao distribufdos com media 0 e 
desvio padrao 1). Convertendo resfduos em 
escores-z (resfduos padronizados), podemos 
compara-los entre diferentes modelos e utili- 
zarmos o que sabemos sobre os escores-z para 
derivar propriedades gerais sobre o que seria 
um valor aceitavel (ou inaceitavel). Por exem- 
plo, vimos no Capftulo 3 que, numa amostra 
normalmente distribufda, 95% dos escores-z 
devem estar entre — 1,96 e +1,96, 99% devem 
estar entre —2,58 e +2,58 e que 99,9% (isto e, 
praticamente todos) devem ficar entre —3,29 e 
+3,29. Algumas regras gerais para os resfduos 
padronizados sao derivadas desses fatos: (1) 
resfduos padronizados com um valor absoluto 
maior do que 3,29 (de fato, normalmente utili¬ 
zamos 3) sao preocupantes porque geralmen- 
te, em uma amostra, valores grandes assim 
dificilmente ocorrem por acaso; (2) se mais 
do que 1% da amostra padronizada apresenta 
resfduos padronizados com valores absolutos 
maiores do que 2,58 (normalmente utilizamos 
2,5), existem evidencias de que o nfvel de erro 
dentro do nosso modelo e inaceitavel (o mo- 
delo nao se ajusta bem aos dados da amostra); 
e (3) se mais de 5% dos casos tern resfduos 
padronizados com um valor absoluto maior 
do que 1,96 (normalmente utilizamos 2 por 
conveniencia), tambem ha evidencias de que o 
modelo e uma representagao ruim dos dados. 

Uma terceira forma de resfduo e o residuo 
estudentizado, que e o valor nao padronizado 
dividido por uma estimativa do desvio padrao 
entre eles que varia ponto a ponto. Esses resf¬ 
duos apresentam as mesmas propriedades que 


os padronizados, mas normalmente fornecem 
uma estimativa mais precisa da variancia do 
erro para um caso especffico. 



5.6.1.2 Casos influentes ® 

Alem de procurar valores atfpicos olhan- 
do para os erros do modelo, tambem e pos- 
sfvel buscar certos casos que influenciam os 
parametros do modelo. Assim, se retirassemos 
determinados casos, obterfamos coeficientes 
da regressao diferentes? Esse tipo de anali- 
se pode ajudar a determinar se o modelo de 
regressao e estavel por toda a amostra ou se 
ele pode estar sendo influenciado somente por 
poucos casos. Novamente, esse processo ira 
revelar os valores atfpicos. 

Existem varias estatfsticas 
residuais que podem ser utili- 
zadas para avaliar a influencia 
de um caso em particular. Uma 
dessas estatfsticas e o valor 
previsto ajustado, utilizada quando esse caso 
e exclufdo da analise. De fato, o computador 
calcula o novo modelo sem o caso em questao 
e entao usa esse novo modelo para prever o va¬ 
lor que esse caso teria. Se o caso nao exerce 
uma grande influencia sobre o modelo, e espe- 
rado que o valor previsto e o valor previsto 
ajustado sejam semelhantes. Simplificando, se 
o modelo e estavel, o valor previsto para o caso 
deve ser o mesmo nao importa se ele tenha sido 
utilizado ou nao para determinar o modelo. A 
diferenga entre o valor previsto ajustado e o 
valor previsto original e conhecida como 
DFFit (veja adiante). Podemos ainda analisar 
o resfduo com base no valor previsto ajustado: 
isto e, a diferenga entre o valor previsto ajusta¬ 
do e o valor original ajustado. Esse e o resfduo 
exclufdo. Esse resfduo pode ser dividido pelo 
erro padrao para fornecer um valor padroniza¬ 
do conhecido como resfduo exclufdo estu¬ 
dentizado. Esse resfduo pode ser comparado 
entre diferentes analises de regressao porque 
ele e medido em unidades padronizadas. 

Os resfduos exclufdos sao muito uteis 
para verificar a influencia de um caso na habi- 
lidade de o modelo prever esse caso. Contudo, 
eles nao fornecem informagao sobre como um 
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caso influencia o modelo como um todo (isto 
e, o impacto que um caso tem na habilidade 
do modelo prever todos os casos). Uma esta¬ 
tistica que considera o efeito de um unico caso 
no modelo como um todo e a distancia de 
Cook. Ela e uma medida da influencia global 
de um caso sobre o modelo e Cook e Weisberg 
(1982) sugeriram que valores maiores do que 
1 merecem atcncao. 

Uma segunda medida desse tipo e a in- 
fluencia ( leverage) - algumas vezes denomi- 
nada valores chapeu ( hat values ) que mede 
o quanto um valor observado influencia o va¬ 
lor previsto da variavel de safda. O valor me¬ 
dio da influencia e definido como (k + 1 )/n, 
onde k e numero de previsores do modelo e 
neo numero de participantes. 6 Os valores da 
influencia podem variar entre 0 (indicando 
que o caso nao tem influencia alguma) e 1 (in¬ 
dicando que o caso tem total influencia sobre 
a previsao). Se nenhum caso exerce excessiva 
influencia sobre o modelo, espera-se que to- 
dos os valores da influencia estejam proximos 
do valor medio ((k + 1 )/n). Hoaglin e Welsch 
(1978) recomendam investigar casos com va¬ 
lores maiores do que 2 vezes o valor medio 
(2 (k + 1 )/n) e Stevens (1992) recomenda utili- 
zar o triplo do valor medio (3{k + 1 )/n) como 
uma base para identificar casos que exercem 
grande influencia. Veremos como utilizar es¬ 
ses pontos de corte na Secao 5.8.6. Entretanto, 
casos com grandes valores de influencia nao 
terao necessariamente uma grande influen¬ 
cia nos coeficientes da regressao porque eles 
estao mensurados na unidade da variavel de 
safda em vez de nas dos previsores. 

Relacionados aos valores de influencia 
estao as distancias de Mahalanobis (Figura 
5.8), que medem os afastamentos dos valores 
a partir das medias das variaveis previsoras. 
Voce precisa olhar para os casos com os maio¬ 
res valores. Nao e facil estabelecer um ponto a 
partir do qual teremos motivos para ficarmos 


6 Voce pode encontrar a media da influencia representada 
como pin, onde p 6 o numero de parametros sendo es- 
timados. Na regressao multipla, estimamos parametros 
para cada previsor e tambem para a constante; assim, p e 
equivalente ao numero de previsores mais 1 (k + 1). 



Figura 5.8 Prasanta Chandra Mahalanobis 
olhando para o horizonte. 


preocupados, embora Barnett e Lewis (1978) 
tenham produzido uma tabela de valores crfti- 
cos que depende do numero de previsores e do 
tamanho da amostra. A partir desse trabalho, 
fica claro que mesmo com grandes amostras 
(N = 500) e cinco previsores, valores acima 
de 25 sao motivos de alerta. Em pequenas 
amostras (N = 100) com poucos previsores 
(normalmente tres) valores maiores do que 
15 sao problematicos, e em amostras bastante 
pequenas (N = 30) com somente dois previ¬ 
sores, valores maiores do que 11 devem ser 
examinados. Para mais detalhes, veja a tabela 
de Barnett e Lewis (1978). 

E possfvel executar uma analise de regres¬ 
sao com o caso inclufdo e entao executa-la 
novamente com o mesmo caso exclufdo. Se fi- 
zermos isso, sem duvida existirao algumas dife- 
rengas entre os coeficientes b nas duas equa$oes 
de regressao. Essas diferengas nos informarao 
quanta influencia um determinado caso tem 
nos parametros do modelo de regressao. Como 
exemplo, imagine duas variaveis que apresen- 
tam um relacionamento negativo perfeito exce- 
to por um unico caso (caso 30). Se a analise de 
regressao for realizada com os 29 casos que es¬ 
tao linearmente relacionados de forma perfeita, 
obteremos um modelo no qual a variavel previ- 
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sora X preve perfeitamente a variavel de saida Y 
e nao existirao erros. Se executarmos a analise 
novamente, mas desta vez incluindo o caso que 
nao se ajusta (caso 30), o modelo resultante 
tera parametros diferentes. Alguns dados estao 
armazenados no arquivo dfbeta.sav que ilus- 
tra esta situacao. Tente executar uma regressao 
simples primeiro com todos os casos incluidos 
e depois sem o caso 30. Os resultados estao re- 
sumidos na Tabela 5.1, que mostra (1) os pa¬ 
rametros para o modelo de regressao quando o 
caso extremo esta incluido ou excluido; (2) as 
equagoes de regressao resultantes; e (3) o valor 
de Y previsto para o escore do participante 30 
na variavel x (que e obtido substituindo o valor 
de X na equagao de regressao pelo escore X do 
participante 30, que el). 

Quando o caso 30 e excluido, esses dados 
apresentam um relacionamento negativo per- 
feito: o coeficiente para o previsor (/;,) e — 1 
(lembre que na regressao simples esse termo 
e o mesmo que o coeficiente de correlacao de 
Pearson) e o coeficiente para a constante (o 
intercepto, b 0 ) e 31. Contudo, quando o caso 
30 e incluido, os dois parametros sao reduzi- 
dos 7 e a diferenga entre os parametros tambem 
e mostrada. A diferenca entre um parametro 
estimado utilizando todos os casos e estimado 
quando um caso e excluido e conhecida como 
DFBeta no SPSS. O DFBeta e calculado pra 
cada caso e para cada um dos parametros do 
modelo. Assim, no nosso exemplo, o DFBeta 
para a constante e — 2 e o DFBeta para o pre¬ 
visor e 0,1. Olhando para esses valores do DF¬ 
Beta, e possivel identificar casos que tern uma 


7 O valor de b, e reduzido porque os dados nao apresen- 
tarn mais um rela$ao linear perfeita e existe agora uma 
variancia que o modelo nao pode explicar. 


grande influencia nos parametros do modelo 
de regressao. Novamente, as unidades de me- 
didas utilizadas afetarao esses valores, portan- 
to, o SPSS produz um DFBeta padronizado. 
Esses valores padronizados sao mais faceis de 
usar porque pontos de corte universais podem 
ser aplicados. Nesse caso, valores absolutos 
acima de 1 indicam casos que substancialmen- 
te influenciam os parametros do modelo (em- 
bora Stevens, 1992, sugira olhar para os casos 
com valores absolutos maiores do que 2). 

Uma estatistica relacionada e a DFFit, 
que e a diferenca entre o valor previsto para o 
caso quando o modelo e calculado incluindo o 
caso e quando o modelo e calculado excluindo 
o caso; neste exemplo, o valor e —1,09 (veja 
a Tabela 5.1). Se um caso nao e influente, seu 
DFFit deve ser 0 - no entanto, e esperado que 
mesmo casos nao-influentes tenham pequenos 
valores DFFit. Contudo, ha o problema de que 
essa estatistica depende da unidade de medida 
da variavel de saida e, assim, um DFFit de 0,5 
sera muito pequeno se a saida variar de 1 a 
100, mas muito grande se as saidas variarem 
de 0 a 1. Portanto, o SPSS tambem apresen- 
ta uma versao padronizada dos valores DFFit 
(DFFit padronizados). Uma medida final e a 
razao de covariancia (CVR), que e uma medi¬ 
da de quanto um caso influencia a variancia 
dos parametros de regressao. Uma descri^ao 
do calculo dessa estatistica deixaria muitos 
leitores tontos e confusos, portanto, e suficien- 
te dizer que se essa razao esta proxima de 1, o 
caso tem pouca influencia nas variancias dos 
parametros do modelo. Belsey, Kuh e Welsch 
(1980) recomendam o seguinte: 

• SeCVR, > 1 + [(3(k +1 )//;], entao excluir 
o i-esimo caso prejudicara a precisao de 
alguns dos parametros do modelo. 


Tabela 5.1 A diferenga entre os parametros do modelo de regressao quando um caso e excluido 


Parametros b 

Caso 30 incluido 

Caso 30 excluido 

Diferenga 

Constante (Intercepto) 

+ 29,00 

31,00 

-2,00 

Previsor (Inclinagao) 

-0,90 

-1,00 

0,10 

Modelo (Linha de regressao) 

Y = (—0,9)X + 29 

Y = (-I)X + 31 


Y previsto 

28,10 

30,00 

-1,09 
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Quadro 5.1 


A diferen$a entre residuos e estatisticas de influencia © 

Nesta segao, descrevemos duas maneiras de procurar casos que podem prejudicar o modelo: 
residuos e as estatisticas de influencia. Para ilustrar como essas medidas diferem, imagine que o 

prefeito de Londres do final do seculo pas- 
sado estivesse interessado em como o ato 
de beber afetava a mortalidade. Londres e 
dividida em diferentes regioes denomina- 
das municipios e, dessa forma, ele pode 
contar o numero de bares e o numero de 
mortes durante um periodo de tempo em 
oito dos seus municipios. Os dados estao 
em um arquivo denominado pubs.sab. 

0 diagrams de dispersao desses dados 
revela que sem o ultimo caso, existe um 
relacionamento linear perfeito (a linha reta 
pontilhada). No entanto, a presenga do ul¬ 
timo caso (caso 8) muda dramaticamente 
a linha de melhor ajuste (embora essa seja 
ainda um ajuste significativo dos dados 
- faga a analise de regressao e veja voce 
mesmo). 

E interessante olharmos para os residuos e para as estatisticas de influencia desses dados. 
0 residuo padronizado para o caso 8 e o segundo menor: esse valor atipico produz um residuo 
bem pequeno (muitos dos dados tipicos tern residuos maiores) porque ele esta bastante proxi¬ 
mo da linha que foi ajustada aos dados. Como isso pode acontecer? Olhe para as estatisticas de 
influencia e veras que elas sao enormes para o caso 8, exercendo uma influencia muito grande 
no modelo. 

Como sempre, devemos fazer quando nos deparamos com estatisticas estranhas, e preciso 
perguntar o que esta acontecendo no mundo real. 0 ultimo ponto de dados represents a cidade 
de Londres, uma pequena area de apenas uma milha quadrada no centra de Londres onde poucas 
pessoas vivem, mas onde milhares de trabalhadores vem trabalhar e almogam nos bares [pubs). 
Portanto, os bares nao dependem de uma populagao que reside no local para fazer negocios e essa 
populagao nao consumiu toda a sua cerveja! Dessa forma, havia um grande numero de bares. 

Isso ilustra que um caso que influencia muito pode produzir um pequeno residuo - portanto, 
olhe ambos! (Agradego a David Hitchin por esse exemplo, que ele obteve do Dr. Richard Roberts.) 



Case summaries a (Resumo dos casos) 




Standardized 

Residual 

(Residuos 

padronizados) 

Centred Leverage 
Value (Valor da 
Influencia Centrado) 

Standardized 
DFFit (DFFit 
padronizados) 

Standardized 
DFBETA Intercept 
(Intercepto DFBETA 
padronizado) 

Standardized 
DFBETA PUBS 
(DFBETA Bares 
padronizado) 

1 


-1.33839 

0,04074 

-0,74402 

-0,74317 

0,36886 

2 


-0,87895 

0,03196 

-0,40964 

-0,40766 

0,18484 

3 


-0,41950 

0,02424 

-0,17697 

-0,17494 

0,07132 

4 


0,3995 

0,01759 

0,01606 

0,01572 

-0,00564 

5 


0,49940 

0,01200 

0,20042 

0,19337 

-0,05933 

6 


0,95885 

0,00748 

0,40473 

0,38333 

-0,09618 

7 


1,41830 

0,00402 

0,68084 

0,62996 

-0,12023 

8 


-0,27966 

0,86196 

-460379232,7 

92676016,019 

-430238878,2 

Total 

N 

8 

8 

8 

8 

8 


a Limitado aos primeiros 100 casos. 
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• SeCVR, < 1 — \(3(k 4 1)/n], entao excluir 
o i-esimo caso ira melhorar a precisao de 
alguns dos parametros do modelo. 



Nas duas expressSes, k€o 
numero de previsores do mode¬ 
lo, CVR, e a razao da covarian- 
cia para o i-esimo participante 
e n e o tamanho daamostra. 


5.6.1.3 Um comentario final sobre 
estatisticas diagnostico © 

Existem muitas estatisticas diagnostico 
que devem ser examinadas apos a execucao 
de uma analise de regressao e e dificil resumir 
essa riqueza de material em uma conclusao 
concisa. Contudo, eu gostaria de salientar um 
ponto discutido por Belseu e colaboradores 
(1980), que notou o perigo inerente nesses pro- 
cedimentos. O problema e que os diagnostics 
sao recursos que permitem ver quao bom ou 
ruim e o seu modelo em termos da aderencia 
aos dados da amostra. Eles sao uma forma de 
avaliar o seu modelo. Eles nao sao, contudo, 
uma forma de justificar a remogao de dados 
que afetam algumas mudangas desejaveis nos 
parametros da regressao (por exemplo, elimi- 
nar um caso que muda um valor b nao-signifi- 
cativo para um significativo). Stevens (1992), 
como sempre, oferece um excelente conselho: 

Se um ponto e um significativo valor atf- 
pico em Y, mas a sua distancia de Cook 
e menor do que um, nao existe motivo 
real para eliminar esse ponto, uma vez 
que ele nao apresenta um grande efeito 
na analise de regressao. Contudo, exis¬ 
te ainda o interesse de estudar tal ponto 
para tentar entender por que ele nao esta 
aderindo ao modelo (p. 118). 

5.6.2 Interpretando o modelo de 
regressao II: generalizagao © 

Quando uma analise de regressao e feita, 
uma equagao correta para os valores da amos¬ 
tra observada pode ser produzida. Entretanto, 
nas ciencias sociais normalmente estamos in- 
teressados em generalizar nossas descobertas 


para alem da amostra observada. Assim, em- 
bora possa ser util tirar conclusoes sobre uma 
amostra particular de pessoas, geralmente e 
mais interessante se pudermos assumir que 
nossas conclusoes sao verdadeiras para uma 
populagao mais ampla. Para generalizar um 
modelo de regressao, devemos estar seguros 
de que as suposigoes foram satisfeitas, e para 
testar se o modelo de fato e generalizavel, po- 
demos fazer uma validagao cruzada. 

5.6.2.1 Avaliando hipoteses © 

Para tirar conclusoes sobre uma populagao 
com base em um modelo de regressao realizado 
sobre uma amostra, varias suposigoes (hipote¬ 
ses) devem ser verdadeiras (veja Berry, 1993). 

• Tipos de variaveis: Todas as variaveis pre- 
visoras devem ser quantitativas ou catego- 
ricas (com duas categoriais), e a variavel 
de safda deve ser quantitativa, contfnua e 
nao-limitada. Quantitativa significa que ela 
deve ser mensurada por intervalos e nao-li- 
mitada quer dizer que nao devem existir 
restrigoes na variabilidade da safda. Se a 
safda e uma medida que varia de 1 a 10 e 
os dados coletados variam entre 3 e 7, entao 
esses dados sao restritos. 

• Variancia nao-nula: Os previsores de¬ 
vem ter alguma variagao nos valores (isto 
e, eles nao devem ter variancia zero). 

• Multicolinearidade nao deve ser perfei- 
ta: Nao deve existir relacionamento linear 
perfeito entre dois ou mais previsores. 
Assim, as variaveis previsoras nao devem 
apresentar correlagoes muito altas (veja a 
Segao 5.6.2.4). 

• Previsores nao-correlacionados com 
“variaveis externas”: Variaveis extemas 
sao variaveis que nao foram inclufdas no 
modelo de regressao e que influenciam a 
variavel de safda. 8 Essas variaveis podem 


Alguns autores se referem a essas variaveis externas 
como parte de um termo erro que inclui qualquer fator 
aleatorio no modo pelo qual a safda varia. Contudo, 
para evitar confusao com os termos resfduos na equa¬ 
gao de regressao, escolhi denomina-las “variaveis ex- 
ternas”. Embora esse termo implicitamente anule qual¬ 
quer fator aleatorio, eu reconhego esses fatores aqui! 
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ser pensadas como semelhantes a uma 
“terceira variavel” que foi discutida na 
correlagao. Essa suposigao significa que 
nao devem existir variaveis externas que 
se correlacionam com qualquer uma das 
variaveis inclufdas no modelo de regres- 
sao. Obviamente, se as variaveis externas 
se correlacionam com os previsores, as 
conclusoes feitas com o modelo nao serao 
confiaveis (porque outras variaveis tambem 
podem prever a safda de forma precisa). 

• Homocedasticidade: A cada nivel das 
variaveis previsoras, a variancia do termo 
residual deve ser constante. Isso significa 
que os resfduos a cada nivel dos previso¬ 
res devem ter a mesma variancia (homo¬ 
cedasticidade): quando as variancias sao 
desiguais diz-se que existe heterocedasti- 
cidade (veja a Segao 3.6 tambem). 

• Erros independentes: Para quaisquer 
duas observagoes os termos resfduos de¬ 
vem ser nao-correlacionados (ou inde¬ 
pendentes). Essa eventualidade e algumas 
vezes descrita como falta de autocorre- 
lacao. Essa suposigao pode ser verificada 
com o teste de Durbin-Watson, que testa 
a correlagao serial entre erros. Especifica- 
mente, ele testa se resfduos adjacentes sao 
correlacionados. A estatistica teste pode 
variar entre 0 e 4, com 2 significando 
que os resfduos nao sao correlacionados. 
Um valor maior do que 2 indica correla¬ 
gao negativa entre resfduos adjacentes e 
um valor abaixo de 2 indica uma corre¬ 
lagao positiva. O tamanho da estatistica 
de Durbin-Watson depende do numero 
de previsores do modelo e do numero de 
observagoes. Para ser acurado, voce deve 
olhar os valores aceitaveis exatos no ar- 
tigo original de Durbin e Watson (1951). 
Uma regra bastante conservadora, afirma 
que valores menores do que 1 ou maiores 
do que 3 sao definitivamente motivos de 
preocupagao; contudo, valores proximos 
de 2 tambem podem ser problematicos 
dependendo da sua amostra e modelo. 

• Erros normalmente distribufdos: Pre- 
sume-se que os resfduos em um modelo 


sao variaveis aleatorias, normalmente dis- 
tribufdas com media zero. Essa hipotese 
significa que as diferengas entre o modelo 
e os dados observados sao com mais fre- 
quencia zero ou muito proximas a zero e 
que diferengas muito maiores do que zero 
acontecem apenas ocasionalmente. Algu¬ 
mas pessoas confundem essa hipotese com 
a ideia de que os previsores tern que ser 
normalmente distribufdos. Na verdade, os 
previsores nao precisam ser normalmente 
distribufdos (veja a Segao 5.10). 

• Independence : Assume-se que todos os 
valores da variavel de safda sao indepen¬ 
dentes (em outras palavras, cada valor da 
variavel de safda provem de uma entidade 
separada). 

• Linearidade: Os valores medios da varia¬ 
vel de safda para cada incremento nos pre¬ 
visores devem estar sobre a linha. Em ou¬ 
tras palavras, isso significa que e assumido 
que o relacionamento que estamos mode- 
lando e do tipo linear. Se modelarmos um 
relacionamento nao-linear utilizando um 
modelo linear, isso obviamente limita a 
generalizagao do que encontrarmos. 

Essa lista de hipo- 
teses parece desestimu- 
lante e, de fato, muitos 
alunos de graduagao 
(e alguns professores 
tambem) tendem a 
considerar as hipoteses 
como um assunto tedio- 
so com o qual ninguem 
deveria ser preocupar. Quando menciono as 
suposigoes estatfsticas para psicologos, eles 
tendem a me langar um olhar do tipo “voce e 
realmente pedante” e entao me ignoram. Con¬ 
tudo, existem boas razoes para levar as suposi- 
g5es a serio. Imagine que eu vou a casa de um 
amigo e as luzes estao acesas e e obvio que 
alguem esta em casa. Eu toco a campainha da 
porta e ninguem atende. A partir dessa expe- 
riencia, concluo que o meu amigo me odeia e 
que sou uma pessoa terrfvel e mal-amada. Ate 
que ponto essa conclusao e verdadeira? Bern, 
existe uma realidade que estou tentando ana- 
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lisar (isto e, se o meu amigo gosta ou nao de 
mim) e eu coletei dados sobre essa realidade 
(eu fui a casa dele, vi que ele esta em casa, 
toquei a campainha e nao obtive resposta). 
Imagine que na verdade o meu amigo gosta 
de mim (ele nunca soube escolher bem os seus 
amigos!); neste cenario, minha conclusao e 
falsa. Por que os meus dados me levaram a 
uma conclusao errada? A resposta e simples: 
eu assumi que a campainha da porta do meu 
amigo estava funcionando e sob essa suposi- 
cao a conclusao que fiz a partir dos meus fa- 
tos foi precisa (meu amigo ouviu a campai¬ 
nha, mas escolheu me ignorar porque ele me 
odeia). Contudo, essa suposigao nao era ver- 
dadeira - sua campainha nao estava funcio¬ 
nando e foi por isso que ele nao respondeu - e, 
como conseqiiencia, a conclusao que fiz sobre 
a realidade foi completamente falsa. 

Chega de campainhas, amigos e minha 
vida social: o ponto a ser lembrado e que, 
quando as hipoteses sao ignoradas, nos para¬ 
mos de tirar conclusoes validas sobre a rea¬ 
lidade. Em termos de regressao, quando as 
suposigoes sao consideradas, o modelo que 
obtemos de uma amostra pode ser aplicado de 
forma precisa para a populagao de interesse 
(os coeficientes da equagao de regressao nao 
sao tendenciosos ). Algumas pessoas assumem 
que isso significa que quando as hipoteses 
sao satisfeitas, o modelo de regressao de uma 
amostra e sempre identico ao modelo que se- 
ria obtido se fossemos capaz de testar toda a 
populagao. Infelizmente, essa crenga nao e 
verdadeira. O que um modelo nao tendencioso 
nos diz e que, em media, o modelo de regres¬ 
sao obtido a partir de uma amostra e o mesmo 
que o modelo populacional. Entretanto, deve 
ficar claro que mesmo quando as suposigoes 
sao satisfeitas, e possfvel que um modelo ob¬ 
tido a partir de uma amostra nao seja igual ao 
modelo populacional - mas a probabilidade 
de serem identicos aumenta. 

5.6.2.2 Validagao cruzada do modelo ® 

Mesmo se nao pudermos ter certeza de 
que o modelo derivado da nossa amostra re- 


presenta de forma precisa toda a populagao, 
existem maneiras de determinar quao bem 
nosso modelo pode prever a safda em uma 
amostra diferente. Determinar a precisao de 
um modelo entre diferentes amostras e conhe- 
cido como validagao cruzada. Se um modelo 
pode ser generalizado, ele deve ser capaz de 
prever de modo preciso a mesma variavel de 
safda a partir do mesmo conjunto de previ- 
sores em um grupo de pessoas diferentes. Se 
o modelo e aplicado a uma amostra distinta 
e existe uma grande diferenca na sua capaci- 
dade de previsao, entao o modelo claramente 
nao e generalizavel. Como uma primeira regra 
pratica, nos devemos coletar dados suficientes 
para obter um modelo de regressao confiavel 
(veja a proxima segao). Uma vez determinado 
o modelo de regressao, existem dois metodos 
principals de validagao cruzada: 

• R 2 ajustado: No SPSS, nao apenas os va- 
lores de R e R 2 sao calculados, mas tam- 
bem um R ajustado. Esse valor ajustado 
significa a perda do poder de previsao ou 
encolhimento. O R 2 informa quanto da va- 
riancia de Y pode ser creditada ao modelo 
de regressao amostral, e o valor ajustado 
nos informa quanta variancia de Y pode 
ser creditada ao modelo se ele tiver sido 
derivado da populagao de onde a amostra 
foi retirada. O SPSS determina o valor R 2 
ajustado utilizando a equagao de Wherry. 
Contudo, essa equagao tem sido criticada 
porque nada informa sobre quao bem o 
modelo de regressao preveria um conjun¬ 
to de dados inteiramente diferente (quao 
bem o modelo preve escores de diferentes 
amostras retiradas da mesma populagao?). 
Uma versao do R 2 que nos informa quao 
bem o modelo valida de forma cruzada 
utiliza a formula de Stein, mostrada na 
equagao (5.11) (veja Stevens, 1992): 

R 2 ajustado = 


[/ n — 1 \ 

f n ~ 2 \ 

(n + ni 

\n-k- 1/ 

\n-k-2] 

l » jj 


(5.11) 
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Na equa 9 ao de Stein, R 2 6 o valor nao 
ajustado, n e o numero de casos e k e o 
ruimero de previsores no modelo. Para os 
que se dao bem com a matematica, vale 
a pena utilizar essa equacao para fazer a 
validaqao cruzada do modelo. 

• Divisao dos dados: Essa abordagem en- 
volve dividir ao acaso o conjunto de da¬ 
dos em dois, determinar a equacao de re¬ 
gressao em cada uma das duas metades e 
depois comparar os modelos resultantes. 
Contudo, pesquisadores raramente conse- 
guem conjuntos de dados grandes o sufi- 
ciente para executar esse tipo de analise. 

5.6.2.3 Tamanho da amostra na 
regressao (D 

Na segao anterior, comen- 
tei que e importante coletar 
dados suficientes para obter 
um modelo de regressao 
confiavel. Mas quanto e o sufi- 
ciente? Ha muitas regras prati- 
cas por af; as duas mais co- 
muns sao que voce deve ter 10 
casos de dados para cada pre¬ 
visor no modelo ou 15 casos de dados por pre¬ 
visor. Assim, se voce tivesse cinco previsores, 
seria necessario 50 ou 75 casos, respectivamen- 
te (dependendo da regra que voce escolhesse). 
Essas regras sao bastante difundidas (eu mes- 
mo utilizei a regra dos 15 casos por previsor na 
primeira edigao do livro), mas elas simplificam 
demais o assunto. Na verdade, o tamanho da 
amostra necessario ira depender do tamanho de 
efeito que estamos tentando detectar (isto e, 
quao forte e o relacionamento que estamos ten¬ 
tando medir?) e de quanto poder queremos para 
detectar esses efeitos (veja o Capftulo 1). A re¬ 
gra mais simples e: quanto maior a amostra 
melhor! A razao e que a estimativa de R que 
obtemos da regressao e dependente do numero 
de previsores, k, e do tamanho da amostra, N. 
O R esperado para dados aleatorios e k/(n — 1) 
e, dessa forma, com amostras pequenas os da¬ 
dos aleatorios podem parecer mostrar um efeito 
forte; por exemplo, com seis previsores e 21 
casos de dados, R = 6/(21 — 1) = 0,3 (um ta¬ 


manho de efeito medio segundo o criterio de 
Cohen descrito na Segao 4.2.2). Obviamente, 
para dados aleatorios esperanamos que R fosse 
zero (nenhum efeito), e para isso ser verdadei- 
ro, precisamos de grandes amostras (tomando 
o exemplo anterior, se tivessemos 100 casos em 
vez de 21, o R esperado seria 0,06, um valor 
bem mais aceitavel). 

E otimo saber que quanto mais, melhor, 
mas os pesquisadores em geral precisam de 
orientates mais objetivas (adorarfamos cole¬ 
tar 1000 casos de dados, porem, nem sempre 
isso e possfvel!). Green (1991) apresenta duas 
regras praticas pra o tamanho mmimo aceita¬ 
vel de uma amostra, o primeiro tomando por 
base o teste do modelo como um todo (isto e, 
testando o R 2 ) e o segundo tomando por base 

os testes individualizados dos previsores do 
modelo (isto e, testando os valores b do mo¬ 
delo). Se voce quer testar o modelo como um 
todo, ele recomenda um tamanho minimo de 

visores. Assim, se voce tiver cinco previsores, 

ira precisar de um tamanho de amostra de 50 
+ 40= 90. Se voce quiser testar os previsores 
individualmente, ele sugere um tamanho mini- 
mo defl|ii 0 StfiSiBi!jSiBill§ assim, novamente, 
se tivermos cinco previsores, iremos precisar 

itlelum i amostra minim i de 104 + 5 = 109 
elementos. E claro que o na maioria dos casos 
estamos interessados tanto em testar o modelo 
quanto a contribuiqao dos previsores (valores 
b), nesse caso, Green recomenda que voce 
calcule o tamanho da amostra minima (que 
acabei de descrever) pelas duas formas que fo- 
ram apresentadas e adote aquela que fornecer 
o valor mais alto (portanto, no caso de cinco 
previsores, usarfamos 109 em vez de 90). 

Essas recomenda$oes sao um bom guia, 
mas elas continuam simplificando o problema. 
Como ja foi mencionado, o tamanho necessario 
da amostra depende do tamanho de efeito (isto 
e, quao bem nossos previsores preveem a safda) 
e de com quanto poder estatfstico queremos 
detectar esses efeitos. Miles e Shevin (2001) 
fornecem alguns graficos uteis que ilustram o 
tamanho da amostra necessario para obter dife- 
rentes rn'veis de poder para diferentes tamanhos 
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de efeito quando o numero de previsores varia. 
Para uma estimativa precisa do tamanho da 
amostra que voce deve utilizar, recomendo o uso 
desses graficos. Resumi alguns conselhos gerais 
de Miles e Shevin na Figura 5.9. Esse diagrama 
mostra o tamanho da amostra necessario para 
obter altos nfveis de poder (tomei por base o 
valor de 0,8, proposto por Cohen, 1998) depen- 
dendo do numero de previsores e do tamanho de 
efeito esperado. Afgumas fjs recomeallgoefljg; 
Miles e Shevin sao: (1) se voce espera encontrar 
um grande efeito, entao uma amostra de tama- 
'ntibW-lF' 1 u nkWoni^itijCM^piL. niih i’i| 

se existem menos previsores, entao voce podera 
se dar o luxo de ter amostras de tamanhos ainda 
menores; (2) se voce estiver esperando um efei¬ 

to medio, um tamanho de amostra de 200 sera 
suficiente para ate 20 previsores, mas voce deve 
sempre ter um tamanho de amostra acima de 60, 
e com seis ou menos previsores, uma amostra 

de tamanho 100 serd suficiente; e (3) se vocS 
estiver esperando um tamanho de efeito peque- 
no, vai precisar ter tempo e recursos para coletar 

mats se 


5. 6 . 2.4 Multicolinearidade © 

A multicolinearidade existe quando ob- 
servamos uma forte correlagao entre dois ou 
mais previsores em um modelo de regressao. 
A multicolinearidade cria um problema ape- 
nas para a regressao multipla porque (sem 
querer dizer o obvio) a regressao simples tem 
apenas um previsor. Uma colinearidade per- 
feita existe quando pelo menos um previsor e 
uma combina^ao linear perfeita de outros (o 
exemplo mais simples e quando dois previso¬ 
res estao perfeitamente correlacionados - eles 
tem um coeficiente de correla^ao igual a 1). 
Se existe uma colinearidade perfeita entre pre¬ 
visores, torna-se impossrvel obter estimativas 
unicas dos coeficientes de regressao porque 
existe um numero infinito de combinagoes 
de coeficientes que funcionarao igualmente 
bem. Simplificando, se tivermos dois previ¬ 
sores que sao perfeitamente correlacionados, 
os valores de b de cada variavel podem ser 
trocados. A boa notfcia e que a colinearidade 
perfeita e rara com dados reais. A ma notfcia 
e que uma colinearidade nao-perfeita e prati- 



Figura 5.9 Diagrama mostrando o tamanho da amostra necessario na regressao em fungao do 
numero de previsores e do tamanho de efeito esperado. 
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camente inevitavel. Nlveis baixos de colinea- 
ridade nao representam uma ameaca para os 
modelos gerados pelo SPSS, mas a medida 
que a colinearidade aumenta, tambem aumen- 
tam os erros padroes dos coeficientes b, que 
por sua vez afetam a significancia estatistica 
desses coeficientes. Resumindo, altos niveis 
de colinearidade aumentam a probabilidade 
de que um bom previsor da variavel de saida 
seja declarado nao-significativo e excluido do 
modelo (Erro do Tipo II). Existem tres outras 
razoes por que a presenga de multicolinearida- 
de representa uma ameaca a validade de uma 
analise de regressao multipla: 

• Ela limita o tamanho do R: Lembre que 
R e uma medida de correlagao multipla 
entre os previsores e a saida e que R 2 in- 
dica a variancia da saida que e de respon- 
sabilidade dos previsores. Imagine uma 
situagao em que uma unica variavel preve 
a variavel de saida com um sucesso ra- 
zoavel (por exemplo, R = 0,80) e, depois, 
uma segunda variavel previsora e adicio- 
nada ao modelo. Essa segunda variavel 
deve ser responsavel por boa parte da va¬ 
riancia dos resultados (que e o motivo de 
ela ter sido acrescentada ao modelo), mas 
a variancia que pode ser debitada a ela e 
a mesma da primeira variavel. Em outras 
palavras, uma vez que a variancia debitada 
a primeira variavel tenha sido removida, 
o segundo previsor torna-se responsavel 
por muito pouco da variancia restante (a 
segunda variavel apresenta uma variancia 
propria muito pequena). Assim, a variavel 
total dos resultados que pode ser debita¬ 
da aos dois previsores e um pouco maior 
apenas do que quando um unico previsor 
estava no modelo (assim, R pode aumen- 
tar de 0,80 para 0,82). Essa ideia esta co- 
nectada a nogao de correlagao parcial que 
foi explicada no Capltulo 3. Se, contudo, 
os dois previsores sao completamente 
nao-correlacionados, o segundo previsor 
tem uma probabilidade maior de ser res¬ 
ponsavel por uma variancia dos resultados 
do que quando existia um unico previsor. 
Dessa forma, embora por si so o segundo 


previsor seja responsavel apenas por uma 
pequena parte da variancia dos resultados, 
a variancia debitada aos dois e diferente 
do que quando tinha apenas um previsor 
(portanto, quando ambos estao no modelo, 
R aumenta substancialmente, por exem¬ 
plo, para 0,95). Desse modo, previsores 
nao-correlacionados sao desejaveis. 

• Importancia dos previsores: A multi- 
colinearidade entre previsores dificulta a 
avaliagao da importancia individual de um 
previsor. Se os previsores sao altamente 
correlacionados e cada um e responsavel 
por uma variancia similar dos resultados, 
como podemos saber qual entre duas va- 
riaveis e mais importante? Simples: nao 
podemos dizer qual e a mais importante, 
o modelo pode incluir qualquer uma delas 
de forma intercambiavel. 

• Equagoes com previsores instaveis: 
Descrevi como a multicolinearidade au¬ 
menta as variancias dos coeficientes de 
regressao, resultando em equagoes com 
previsores instaveis. Isso significa que um 
valor estimado dos coeficientes de regres¬ 
sao (os valores b) sera instavel de amostra 
para amostra. 

Uma forma de identificar multicolineari¬ 
dade e examinar a matriz de correlagoes de to- 
das as variaveis previsoras e ver se alguma se 
correlaciona de forma bastante alta (por alta 
queremos dizer acima de 0,80 ou 0,90). Esse e 
um metodo pratico, mas deixa escapar formas 
mais sutis de multicolinearidade. Felizmente, 
o SPSS produz varios diagnosticos de colinea¬ 
ridade, entre eles o FIV (Fator de Inflagao da 
Variancia). O FIV indica se um previsor tem 
um relacionamento linear forte com outro(s) 
previsor(es). Embora nao existam regras sim¬ 
ples sobre quais valores do FIV devem ser 
motivo de alerta, Meyers (1990) sugere que 10 
e um bom valor a partir do qual podemos nos 
preocupar. Bowerman e O’Connel (1990) su- 
gerem que se na media o FIV e maior do que 
1, a multicolinearidade pode tornar o modelo 
de regressao tendencioso. Relacionado ao va¬ 
lor FIV existe a estatistica tolerancia, que e o 
valor inverso de FIV (1/FIV). Assim, valores 
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abaixo de 0,10 indicam problemas serios, em- 
bora Menard (1995) sugira que valores abaixo 
de 0,20 ja sejam motivo de preocupagao. 

Outra medida util na descoberta de valores 
de previsores dependentes sao os autovalores 
da matriz dos produtos cruzados nao reduzi- 
da e nao centrada , o indice de condigao e as 
proporgoes da varidncia. Essas estatfsticas sao 
extremamente complexas e serao abordadas 
na parte de interpretagao das safdas do SPSS 
(veja a Segao 5.8.5). Se nada disso faz sentido 
para voce, de uma olhada em Hutcheson e So- 
froniou (1999, p. 78-85), que fornece uma ex- 
plicagao bastante clara da multicolinearidade. 

5.7 COMO EXECUTAR UMA REGRESSAO 
MULTIPLA NO SPSS © 

5.7.1 Principals opcoes © 

Imagine que um executivo de uma grava- 
dora esta interessado em estender o modelo da 
venda de discos para incorporar outras variaveis. 
Ele decide mensurar duas novas variaveis: (1) o 
numero de vezes que o disco toca na Radio 1 (a 
maior estagao de radio da Gra-Bretanha) durante 
a semana anterior ao langamento (airplay) e (2) a 
atratividade da banda (attract). Antes de um dis¬ 
co ser langado, o executivo anota a quantia gasta 


em publicidade, o numero de vezes que o disco e 
tocado na radio na semana anterior ao seu langa¬ 
mento e a atratividade da banda. Ele faz isso para 
200 tipos diferentes de discos (cada um de uma 
banda diferente). A atratividade e mensurada so- 
licitando a uma amostra aleatoria da audiencia 
pretendida que atribua uma nota variando de 0 
(insossos) a 10 (maravilhosos) para cada banda. 
A moda da atratividade atribufda para cada ban¬ 
da foi utilizada na regressao (porque ele estava 
interessado no que a maioria das pessoas pensa- 
va, em vez da opiniao media das pessoas). 

Esses dados estao no arquivo Record2. 
sav (Discos2.sav) e voce deve perceber que 
cada variavel tem sua propria coluna (o mesmo 
metodo utilizado para a correlagao) e que cada 
linha representa um disco diferente. Assim, o 
primeiro disco apresenta £10 269 de gastos em 
publicidade, vendeu 330 000 copias, foi exe- 
cutado 43 vezes na Radio 1 na semana anterior 
ao seu langamento e a maioria das pessoas jul- 
gou a banda maravilhosa (Figura 5.10). 

O executivo tem pesquisas anteriores indi- 
cando que a quantia investida em publicidade 
e um previsor significativo da venda de discos 
e, assim, ele deve incluir essa variavel primei¬ 
ro no modelo. Suas novas variaveis (airplay e 
attract) devem, dessa forma, entrar no modelo 



Figura 5.10 Apresentagao dos dados para a regressao multipla. 
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apos a quantia investida em publicidade. Esse 
modelo e hierarquico (o pesquisador decide a 
ordem na qual as variaveis devem ser agrega- 
das ao modelo com base em pesquisas ante- 
riores). Para executar o modelo hierarquico no 
SPSS, temos que entrar as variaveis em blocos 
(cada bloco representando um passo na hierar- 
quia). Para chegar a caixa de dialogo princi¬ 
pal da regressao ( regression), voce deve clicar 
no menu Analyze (Analisar) e selecionar Re¬ 
gression (Regressao) e depois Linear (Linear) 
(Analyze=>Regression=> Linear). A caixa de 
dialogo principal e mostrada na Figura 5.11 — 
ela e a mesma que foi utilizada na regressao 
simples. 

A caixa de dialogo principal e bastante 
autoexplicativa: existe um espaco para especi- 
ficar a variavel dependente (saida ou resulta- 
do) e um espago para colocar uma ou mais 
variaveis independentes de entrada (variaveis 
previsoras). As variaveis no editor de dados 
sao listadas num painel a esquerda. Destaque 
ou marque a variavel record sales (vendas de 
discos) na lista clicando sobre ela e a transfira 
para a caixa denominada Dependent (Depen¬ 
dente) clicando em H. Tambem precisamos 
especificar a variavel previsora para o primei- 


ro bloco. Foi decidido que a quantia aplicada 
em publicidade deve ser a primeira variavel a 
entrar no modelo (porque pesquisas anteriores 
indicam que ela e um previsor importante), as- 
sim, marque-a na lista e a transfira para o qua- 
dro a direita rotulado de Independent s) 
(Independente(s)) clicando em _Ll. Na parte 
inferior do quadro das variaveis independen¬ 
tes ( Independent s) ) existe um menu tipo lista 
suspensa onde e possfvel especificar o metodo 
(Method ) da regressao (veja a Segao 5.5.3). 
Voce pode selecionar um metodo diferente de 

entrada de variaveis para cada nr" ] 

, L , . Enter ^ 

bloco clicando em Z., proxi- --= 

mo de onde diz Method (Me- Stepwise 
. i . , , . _ Remove 

todo). A opgao por onnssao 

(i default ) e a entrada forgada Forward w 
e essa e a opgao que quere- 
mos, mas se voce estiver executando um tra- 
balho mais exploratorio, pode escolher um 
dos metodos passo a passo (para a frente - 
forward, para tras - backward, passo a passo 
- stepwise ou remover - remove ). 

Uma vez especificado o primeiro bloco 
da hierarquia, precisamos nos mover para o 
segundo. Para informar ao computador que 
queremos especificar um novo bloco de va- 


Enter 


Stepwise 

▲ 

Remove 


Backward 


Forward 

▼ 



Figura 5.11 Caixa de dialogo principal para o primeiro bloco da regressao multipla. 
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riaveis previsoras voce deve clicar em ^ exl 
(proximo). Esse processo limpa o quadro 
Independents) (Independente) de manei- 
ra que voce pode entrar os novos previsores 
(voce deve notar, tambem, que acima desse 
bloco esta escrito agora Block 2 of 2 (Bloco 
2 de 2), indicando que voce esta no segundo 
bloco dos dois que foram especificados). De- 
cidimos que o segundo bloco deveria conter 
os dois novos previsores, portanto, voce deve 
clicar em airplay e attract na lista de varia- 
veis e transferi-las, uma a uma, para o quadro 
rotulado de Independents) (Independente(s)) 
clicando em iT* l . A caixa de dialogo fica seme- 
lhante a da Figura 5.12. Para se movimentar 
entre os blocos, utilize os botoes P,8 * I<XIS (pre- 

vio) e ^ exl _(proximo) (por exemplo, para 

voltar para o bloco 1, clique em p,9 * Kxlt ). 

E possfvel selecionar metodos diferentes 
de entrada de uma variavel para blocos dife¬ 
rentes em uma hierarquia. Assim, embora ti- 
vessemos especificado a entrada torcada para 
o primeiro bloco, podemos agora especificar 
um metodo passo a passo para o segundo. 
Dado que nao temos pesquisas anteriores em 
rela£ao as variaveis attractiviness (atrativida- 
de) e airplay (numero de reproduces na Ra¬ 
dio 1), em relagao a vendas podemos justificar 


a escolha pelo metodo passo a passo para esse 
bloco. Contudo, em virtude de problemas com 
o metodo passo a passo, optarei pelo de entra¬ 
da forcada para os dois blocos neste exemplo. 

5.7.2 Estatisticas © 

Na caixa de dialogo principal da regres¬ 
sao (regression), clique em 1 (estatfsti- 
cas) para abrir a caixa de dialogo e selecionar 
varias op£5es importantes relacionadas ao 
modelo (Figura 5.13). Muitas dessas opgoes 
estao relacionadas aos parametros do modelo; 
contudo, existem procedimentos disponfveis 
para verificar a hipotese da nao-existencia de 
multicolinearidade (diagnostico de colineari- 
dade) e independencia serial dos erros (Dur¬ 
bin-Watson). Quando voce tiver selecionado 
as estatisticas necessarias (recomendo sele¬ 
cionar todas exceto a matriz de covariancias 
como regra geral), clique em (continue) 
para retornar a caixa de dialogo principal. 

• Estimates (Estimativas): Essa opgao e 
selecionada por omissao porque ela nos 
fornece os coeficientes estimados do mo¬ 
delo de regressao (isto e, estimativas dos 
valores b). A estatfstica teste e sua signifi- 
cancia sao fornecidas para cada coeficien- 



Figura 5.12 Caixa de dialogo principal para o segundo bloco da regressao multipla. 
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Figura 5.13 Caixa de dialogo Statistics (Estat(sticas) para a analise de regressao. 


te de regressao: um teste 1 e utilizado para 
verificar se cada b difere significantemen- 
te de zero (veja a Segao 5.2.4). 

• Confidence intervals (Intervalos de con¬ 
fianga): Essa opgao, se selecionada, pro- 
duz intervalos de confianga para um dos 
coeficientes de regressao nao-padroniza- 
dos. Intervalos de confianga podem ser 
recursos uteis para avaliar a probabilidade 
dos coeficientes de regressao na popula- 
gao - irei descrever as interpretagoes exa- 
tas mais tarde. 

• Covariance matrix (Matriz de covari¬ 
ancias): Se selecionada, essa opgao ira 
apresentar a matriz de covariancias, os 
coeficientes de correlagao e as variancias 
entre os coeficientes de regressao para 
cada variavel no modelo. Uma matriz de 
variancias-covariancias e produzida com 
as variancias apresentadas na diagonal e 
as covariancias como elementos fora da 
diagonal principal. As correlagoes sao 
apresentadas em uma matriz separada. 

• Model fit (Aderencia do modelo): Essa op¬ 
gao e vital e, portanto, ela e selecionada por 
omissao. Ela fornece nao somente um teste 
estatlstico da habilidade de o modelo prever 
a variavel de safda (o teste F - veja a Segao 
5.2.3), mas tambem o valor de R (ou R mul- 
tiplo), o R 2 correspondente e o R 2 ajustado. 

• R squared ihiinge^Altcr^H>9^S19 


ragoes que ocorrem no R 2 resultantes da 

inclusao de um novo previsor (ou bloco 

tn'jfiv'iB 

ra util de avaliar a contribuigao do novo 
previsor (ou conjunto de previsores) na 

explicagao da vari an oBSa^jiiiM 

• Descriptives (Descritivas): Se seleciona¬ 
da, essa opgao mostrara uma tabela com a 
media, o desvio padrao e o numero de ob- 
servagoes de todas as variaveis incluidas na 
analise. A matriz de correlagoes e tambem 
apresentada mostrando as correlagbes entre 
todas as variaveis e a probabilidade unila¬ 
teral para cada coeficiente de correlagao. 
Essa opgao e extremamente util porque a 
matriz de correlagao pode ser utilizada para 
avaliar se os previsores estao inter-relacio- 
nados (o que pode ser utilizado para verifi¬ 
car se existe multicolinearidade). 

• Part and partial correlations (Correlagao 
parcial e por partes): Essa opgao produz a 
correlagao de ordem-zero (a correlagao de 
Pearson) entre cada previsor e a safda, con- 
trolada para todos os outros previsores do 
modelo. Ele produz a correlagao por partes 
(ou correlagao semiparcial) entre cada pre¬ 
visor e a safda. Essa correlagao representa 
o relacionamento entre cada previsor e a 
parte da safda que nao e explicada pelos 
outros previsores no modelo. Como tal, 
ela mede o relacionamento linico entre um 
previsor e a safda (veja a Segao 4.6). 
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• Collinearity diagnostics (Diagnostic de 
colinearidade): Essa opgao serve para ob- 
ter as estatfsticas de colinearidade, como 
VIF, tolerancia, autovalores da matriz re- 
duzida e nao-centrada dos produtos cru¬ 
zados e fndice de condigao e proporgao de 
variancias (veja a Segao 5.6.2.4). 

• Durbin-Watson: Essa opgao produz a es- 
tatfstica teste de Durbin-Watson, que testa 
a suposigao de independencia dos erros. 
Infelizmente, o SPSS nao fornece o valor 
da significance desse teste, assim, voce 
mesmo deve decidir se o valor e suficien- 
temente diferente de 2 para ser motivo de 
preocupagao (veja a Segao 5.6.2.1). 

• Casewise diagnostics (Diagnostics por 
casos): Essa opgao, se selecionada, lista 
os valores observados da safda, os valores 
de safda previstos, a diferenga entre esses 
valores (os resfduos) e essa diferenga pa- 
dronizada. Alem disso, esses valores po- 
dem ser listados para todos os casos ou 
apenas para casos onde o resfduo padroni- 
zado for maior do que 3 (quando o sinal de 
± for ignorado). O criterio de valor igual 
a 3 podera ser alterado e eu recomendo 
altera-lo para 2 por razoes que logo fica- 
rao evidentes. Uma tabela resumo de es¬ 
tatfsticas residuais indicando o mfnimo, o 
maximo, a media e o desvio padrao tanto 
dos valores previstos pelo modelo quanto 
dos resfduos (veja a Segao 5.8.6) tambem 
e produzida. 


5.7.3 Diagramas da regressao © 

Uma vez que voce esteja de volta a caixa 
de dialogo principal, clique em p|0 “ (Gra- 
ficos) para ativar a caixa de dialogo para os 
diagramas {plots ) da regressao, mostrada na 
Figura 5.14. Essa caixa de dialogo fornece os 
meios para especificar varios graficos, que po- 
dem auxiliar no estabelecimento da validade 
de algumas hipoteses da regressao. A maior 
parte desses graficos envolvem varios valores 
residuais (residual), que serao descritos com 
mais detalhes na Segao 5.7.4. 

No lado esquerdo da caixa ha uma lista de 
diversas variaveis. 

• DEPENDNT (a variavel de safda). 

• *ZPRED (os valores previstos padroni- 
zados da variavel dependente com base 
no modelo). Esses valores sao formas 
padronizadas dos valores previstos pelo 
modelo. 

• *ZRESID (os residuos padronizados, ou 
erros). Esses valores sao as diferengas pa¬ 
dronizadas entre os dados observados e os 
valores que o modelo preve. 

• *DRESID (os residuos excluidos). Veja a 
Segao 5.6.1.1 para detalhes. 

• *ADJPRED (os valores previstos ajusta- 
dos). Veja a Segao 5.6.1.2 para detalhes. 

• *SRESID (os residuos estudentizados). 

• *SDRESID (os residuos estudentizados 
excluidos). Esse valor e o resfduo ex- 
clufdo dividido pelo erro padrao. 



Figura 5.14 Regressao linear: caixa de dialogo grafica. 
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As variaveis listadas nessa caixa de dia- 
logo sao todas apresentadas sob um tftulo geral 
de resfduos e foram discutidas em detalhe na 
Segao 5.6.1.1. Para uma analise basica vale a 
pena obter os diagramas do *ZRESID (eixo y) 
contra *ZPRED (eixo x), porque esse grafico 
e util para determinar se as hipoteses de erros 
aleatorios e homocedasticidade foram satisfei- 
tas. Um diagrama do *SRESID (eixo y) contra 
*ZPRED (eixo x) mostrara qualquer heteroce- 
dasticidade tambem. Embora muitas vezes es¬ 
ses dois diagramas sejam praticamente identi- 
cos, o segundo e mais sensfvel em uma situacao 
caso a caso. Para criar esses diagramas, basta 
selecionar uma variavel da lista e transferi-la 
para o espago denominado tanto X quanto Y 
(referentes aos eixos) clicando em ‘ I Quan- 
do voce tiver selecionado as variaveis para o 
primeiro diagrama (neste caso, semelhante ao 
da Figura 5.14) voce pode especificar um novo 
diagrama clicando em t*” 1 (proximo). Esse 
procedimento limpa os espagos em que as va¬ 
riaveis foram especificadas. Se voce clicar em 
t* 9 ” e quiser retornar ao ultimo diagrama 
especificado, clique em Pr< * ,0,ll ‘ (anterior). Voce 
pode especificar ate nove diagramas. 

E possfvel selecionar a caixa de marcar 
denominada Produce all partial plots (Produ- 
za todos os diagramas parciais), que ira de¬ 
terminar diagramas de dispersao dos resfduos 
da variavel de safda e cada um dos previso- 
res quando ambas as variaveis sao analisadas 
separadamente com os previsores restantes. 
Mesmo que voce nao tenha entendido a frase 
anterior, esses diagramas apresentam varias ca- 
racterfsticas importantes que faz valer a pena 
inspeciona-los. Primeiro, o gradiente da linha 
de regressao entre duas variaveis residuais e 
equivalente ao coeficiente do previsor na equa- 
gao de regressao. Assim, qualquer valor atfpico 
obvio em um diagrama parcial representa um 
caso que pode ter excessiva influencia no coe¬ 
ficiente de regressao de um previsor. Segundo, 
relacionamentos nao-lineares entre um previsor 
e a variavel de safda sao mais detectaveis utili- 
zando esses graficos. Finalmente, eles sao for¬ 
mas uteis de detectar colinearidade. Por essas 
razoes, recomendo que eles sejam utilizados. 


Existem varias opgoes para apresentar 
graficamente os resfduos. Primeiro, voce pode 
selecionar um histograma dos resfduos padro- 
nizados (isto e extremamente util para verificar 
a hipotese da normalidade dos erros). Segun¬ 
do, voce pode solicitar um diagrama de pro- 
babilidade normal, que tambem informa se os 
resfduos do modelo sao normalmente distribu- 
fdos. Quando voce tiver selecionado as opgoes 
necessarias clique em . para voltar para a 
caixa de dialogo principal da regressao. 

5.7.4 Salvando os diagnosticos da 
regressao © 

Na Segao 5.6, vimos dois tipos de diag¬ 
nostico da regressao: aqueles que nos ajudam 
a avaliar quao bem o modelo se ajusta a nossa 
amostra e aqueles que nos auxiliam a detectar 
casos que apresentam uma grande influencia 
no modelo gerado. No SPSS, podemos esco- 
lher salvar essas variaveis diagnostico no edi¬ 
tor de dados (assim, o SPSS ira calcula-las e 
criar novas colunas no editor de dados em que 
os valores serao apresentados). 

Para salvar os diagnosticos da regressao, 
voce precisa clicar em Sav<l I (salvar) na caixa 
de dialogo principal da regressao. Esse pro¬ 
cedimento ira ativar a caixa de dialogo para 
salvar as variaveis (veja a Figura 5.15). Uma 
vez que a janela esteja ativa, basta marcar as 
opgdes desejadas nos quadrinhos a direita de 
cada uma. A maioria das opgdes disponfveis 
foram explicadas na Segao 5.6, e a Figura 5.15 
mostra o que eu considero um conjunto ba- 
sico de diagnostico. Versoes padronizadas (e 
estudentizadas) desses diagnosticos sao geral- 
mente mais faceis de interpretar, assim, sugiro 
seleciona-las em vez das versoes nao-padro- 
nizadas. Uma vez que a regressao tenha sido 
executada, o SPSS ira criar uma coluna no edi¬ 
tor de dados para cada uma das estatfsticas so- 
licitadas, e ele tem um conjunto padronizado 
de nomes dessas variaveis para nomear cada 
uma. Depois do nome existira um numero que 
se refere a analise que foi executada. Assim, 
na primeira vez que a regressao e executada, 
o conjunto de nomes das variaveis sera segui- 
do do valor 1; se voce executar uma segunda 
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Figura 5.15 Caixa de dialogo para os diagnosticos da regressao. 


regressao, ele ira criar um segundo conjunto 
de variaveis com o nome seguido pelo valor 
2, e assim por diante. Os nomes das variaveis 
no editor de dados sao apresentados a seguir. 
Depois que voce selecionar os diagnosticos 
desejados (clicando nos lugares adequados), 
clique em para retornar a caixa de dia¬ 
logo principal da regressao. 

• pre_l: (valor previsto nao-padronizado). 

• zpr_l: (valor previsto padronizado). 

• adj_l: (valor previsto ajustado). 

• sep_l: (erro padrao do valor previsto). 

• res_l: (residuo nao-padronizado). 

• zre_l: (residuo padronizado). 

• sre_l: (residuo estudentizado). 

• dre_l: (residuo excluido) 

• sdr_l: (residuo estudentizado excluido). 

• mah_l: (distancia de Mahalanobis). 

• coo_l: (distancia de Cook). 

• lev_l: (valor centrado da influencia). 

• sdb0_l (DFBETA padronizado (inter- 
cepto)). 

• sdbl_l (DFBETA padronizado (previ¬ 
sor 1)). 


• sdb2_l: (DFBETA padronizado (previ¬ 
sor 2)). 

• sdf_l: DFFIT padronizado. 

• cov_l: (razao de covariancia). 

5.7.5 Opgoes adicionais © 

Como uma etapa final da analise voce 
pode clicar em ap “ <l ” para leva-lo a caixa 
de dialogo Op?5es (Figura 5.16). O primeiro 
conjunto de opgSes permite que voce mude os 
criterios utilizados para entrar as variaveis na 
regressao passo a passo {stepwise). Se voce 
insistir em realizar a regressao passo a passo, 
provavelmente e melhor manter o criterio pa¬ 
drao de uma probabilidade de 0,05. Contudo, 
voce pode tornar esse criterio mais restrito 
(0,01). Existe outra opgao para construir um 
modelo que nao inclui a constante (isto e, nao 
apresenta interse 9 ao com o eixo Y). Essa op- 
gao tambem deve ser ignorada! Finalmente, 
voce pode selecionar um metodo para lidar 
com os pontos de dados omitidos (missing). 
Por padrao, o SPSS exclui casos por linhas 
( listwise ), o que significa que se uma pessoa 
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Figura 5.16 Opgoes para a regressao linear. 


tem um valor nao conhecido em uma variavel, 
ela sera excluida da analise. Assim, por exem- 
plo, se o nosso executivo da gravadora nao tem 
um escore para a atratividade de uma de suas 
bandas, os dados desse disco nao serao utili- 
zados no modelo de regressao. Outra opijao 
e excluir casos em uma base de pares, o que 
significa que se o participante tem um escore 
desconhecido para uma variavel em particular, 
seus dados serao exclufdos da analise somente 
em calculos envolvendo a variavel para a qual 
ele nao apresenta valor. Assim, o dado para a 
banda que nao apresenta escore de atratividade 
seria utilizado para calcular o relacionamento 
entre valor investido em publicidade, numero 
de vezes que o disco foi executado na Radio 1 
e discos vendidos. Contudo, se voce fizer isso, 
muitas das suas variaveis podem nao fazer 
sentido, e talvez voce acabe gerando absurdos 
como um R 2 tanto negativo quanto maior do 
que 1,0. Portanto, essa nao e uma boa opcao. 

Outra possibilidade e substituir o valor 
que falta com um valor medio dessa varia¬ 
vel e depois incluir o caso na analise (assim, 
no nosso exemplo a banda teria um valor de 
atratividade igual a medida da atratividade de 
todas as bandas). O problema dessa ultima es- 
colha e que provavelmente o verdadeiro valor 
do desvio padrao sera reduzido (e, ainda mais 
importante, o do erro padrao). O desvio padrao 
sera diminufdo porque para cada caso que for 


substituido nao existira difcrenca entre a me¬ 
dia e o escore a ele atribufdo, enquanto que se 
o dado tivesse sido coletado para o tal caso ele 
quase certamente iria apresentar alguma dife- 
ren^a em rela§ao a media. Obviamente, se a 
amostra e grande e o numero de valores desco- 
nhecidos e pequeno, esse nao e um problema 
serio. Contudo, se existirem muitos valores 
desconhecidos, essa escolha e potencialmente 
perigosa porque erros padrao pequenos terao 
maior probabilidade de resultar em valores 
significativos que serao o produto da substi- 
tui^ao dos dados e nao um efeito verdadei¬ 
ro. A op§ao final e utilizar a rotina do SPSS 
“Analise de valores desconhecidos”, destinada 
para especialistas. Ela faz uso do fato de que 
se as suas variaveis estao presentes e correla- 
cionadas para muitos casos no arquivo e um 
valor ocasional estiver faltando, voce podera 
substituf-lo por estimativas melhores do que a 
media (Tabachnick e Fidell, 2001, Capftulo 4, 
descrevem alguns desses procedimentos). 

5.8 INTERPRETANDO A REGRESSAO 
MULTIPLA © 

Uma boa estrategia para adotar com a re- 

quais existem razoes teoricas para esperar que 
prevejam bem o resultado. Execute a analise de 
regressao em que todos os previsores sao colo- 
cados no modelo e examine a saida para ver 
quais previsores contribuem substancialmente 
para o modelo prever um resultado. Uma vez 
que voce tenha determinado quais sao as varia¬ 
veis importantes, execute novamente a analise 
incluindo somente esses previsores e utilize as 

estimativas dos parametros resultantes para de- 
finir 

revelar que existem dois ou mais previsores 

significativos, voce pode considerar a execu- 
gao de uma analise passo a passo para frente 
(forward stepwise) (em vez de uma entrada 
forcada) a fim de encontrar a contribuicao in¬ 
dividual de cada previsor. 

Gastei um monte de tempo explicando a 
teoria de base da regressao e de algumas das 
ferramentas de diagnostico necessarias para 
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medir a precisao de um modelo de regres¬ 
sao. E importante lembrar que o SPSS pode 
parecer bastante esperto, porem, de fato, ele 
nao e. Ele pode, sim, realizar muitos calculos 
complexos em questao de segundos, mas ele 
nao consegue controlar a qualidade do modelo 
gerado - para tanto, e imprescindfvel um ce- 
rebro humano (e de preferencia um que tenha 
sido treinado). O SPSS pode gerar facilmen- 
te safdas com base em qualquer tipo de lixo 
fornecido no editor de dados e ele nao julgara 
julgar os resultados ou indicar se o modelo e 
generalizavel ou mesmo valido. Contudo, o 
SPSS fornece as estatfsticas necessarias para 
julgar essas coisas e a partir desse ponto nos 
devemos fazer o trabalho - o que e levemente 
preocupante (especialmente se o seu cerebro e 
tao pequeno quanto o meu!). 

Tendo selecionado todas as opgoes rele- 
vantes e retornado a caixa de dialogo princi¬ 
pal, precisamos clicar em °* para executar a 
analise. O SPSS exibira inumeras quantidades 
de safdas na janela visualizadora e nos preci¬ 
samos descobrir como fazer com que essas 
intormacoes facam sentido. 

5.8.1 Descritivas © 

A safda descrita nesta secao e produzida 
utilizando a opcao na caixa de dialogo statis¬ 
tics (estatfsticas) da regressao linear (veja a 
Figura 5.13). Para comepar, se voce selecionou 
a opcao Descriptives (Descritivas), o SPSS ira 
produzir a tabela visualizada na safda do SPSS 
5.4. Essa tabela nos fornece a media e o desvio 
padrao de cada variavel do nosso conjunto de 
dados, assim, sabemos que o numero medio 
de discos vendidos foi de 193.200. Essa tabela 
nao e necessaria para interpretar o modelo de 
regressao, mas e util como resumo dos dados. 
Alem das estatfsticas descritivas, a selegao 


dessa opcao fornece tambem uma matriz de 
corrclapoes. A tabela mostra tres coisas. Pri- 
meiro, e apresentado o valor do coeficiente de 
correlacao de Pearson entre cada par de varia- 
veis (por exemplo, podemos ver que o gasto 
em publicidade tem uma grande correlacao 
positiva com a venda de discos, R = 0,578). 
Segundo, e mostrada a significance unilateral 
de cada correlacao (por exemplo, a correlacao 
acima e significativa, p < 0,001). Finalmente, 
e mostrado o numero de casos que contribui 
com cada correlacao (N = 200). 

Voce deve ter notado que ao longo da dia¬ 
gonal da matriz os valores para os coeficientes 
de correlacao sao todos iguais a 1,00 (isto e, 
uma correlacao positiva perfeita). O motivo 
disso e que esses valores representam a corre¬ 
lacao de cada uma das variaveis com ela mes- 
ma, assim, obviamente os valores resultantes 
sao iguais a 1. A matriz de correlacoes e extre- 
mamente util para fornecer uma ideia aproxi- 
mada do relacionamento entre os previsores e 
a variavel de safda e para um primeiro exame 
da multicolinearidade. Se nao existir multico- 
linearidade nos dados, nao deve existir valores 
de correlacao substanciais (R > 0,90) entre os 
previsores. 

Se olharmos apenas para os previsores (ig- 
norando as vendas de discos), a correlacao mais 
alta e entre a atratividade da banda e a quantida- 
de de execucao significativa ao nfvel de 0,01 (R 
= 0,182 e p = 0,005). A despeito da significan- 
cia dessa correlacao, o coeficiente e pequeno e, 
assim, parece que os previsores estao medindo 
coisas diferentes (nao existe colinearidade). Po¬ 
demos ver, tambem, que de todos os previsores, 
o numero de execucoes na Radio 1 e o que me- 
Ihor se correlaciona com a safda (R = 0,599, p 
< 0,001); portanto, e provavel que essa variavel 
seja a melhor para prever a venda de discos. 



\ 

Dica da Samanta Ferrinho 

Use as estatfsticas descritivas para verificar na matriz de correlagoes a multicoli¬ 
nearidade; isto e, os previsores altamente correlacionados entre si, R > 0,90. 

___ J 
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Saida 5.4 do SPSS Estatisticas descritivas para a analise de regressao 


Descriptive Statistics (Estatistica Descritiva) 



Mean 

(Media) 

Std. Deviation 
(Desvio padrao) 

N 

Record Sales (thousands) (Vendas de discos) (milhares) 

193.2000 

80.6990 

200 

Advertising Budget (Thousands of pounds) Verba de 

614.4123 

485.6552 

200 

publicidade (Milhares de libras) 




No. Of plays on Radio 1 per week (Numero de execu- 

27.5000 

12.2696 

200 

goes na Radio 1 porsemana) 




Attractiveness of Band (Atratividade da Banda) 

6.7700 

1.3953 

200 


Correlations (Correlapoes) 




Record 

Sales 

(thousands) 
(Vendas 
de discos) 
(milhares) 

Advertising 
Budger 
(Verba de 
publicidade) 

No. Od plays 
on Radio 1 
per week 
(Numero de 
execugoes 
na Radio 1 
por semana) 

Attractiveness 
of Band 
(Atratividade 
da Banda) 

Pearson 

Correlation 

Record Sales (thousands) (Vendas de 
discos) (milhares) 

1.000 

0.578 

0.599 

0.326 

(Correlagao 
de Pearson) 

Advertising Budget (Thousands of 
pounds) Verba de publicidade (Mi¬ 
lhares de libras) 

0.578 

1.000 

0.102 

0.081 


No. of plays on Radio 1 per week 
(Numero de execugoes na Radio 1 
por semana) 

0.599 

0.102 

1.000 

0.182 


Attractiveness of Band (Atratividade 
da Banda) 

0.326 

0.081 

0.182 

1.000 

Sig. 

(1-tailed) 

Record Sales (thousands) (Vendas de 
discos) (milhares) 


0.000 

0.000 

0.000 

(Sig,) 

(Unilateral) 

Advertising Budget (Thousands of 
pounds) Verba de publicidade (Mi¬ 
lhares de libras) 

0.000 


0.076 

0.128 


No. of plays on Radio 1 per week 
(Numero de execugoes na Radio 1 
por semana) 

0.000 

0.076 


0.005 


Attractiveness of Band (Atratividade 
da Banda) 

0.000 

0.128 

0.005 


N 

Record Sales (thousands) (Vendas de 
discos) (milhares) 

200 

200 

200 

200 


Advertising Budget (Thousands of 
pounds) Verba de publicidade (Mi¬ 
lhares de libras) 

200 

200 

200 

200 


No. of plays on Radio 1 per week 
(Numero de execugoes na Radio 1 
por semana) 

200 

200 

200 

200 


Attractiveness of Band (Atratividade 
da Banda) 

200 

200 

200 

200 


5.8.2 Resumo do modelo © 

A proxima se£ao da safda descreve o 
modelo globalmente (ela informa se o mo¬ 


delo e eficaz em prever a venda de discos). 
Lembre que escolhemos o metodo hierar- 
quico e, portanto, cada conjunto de estatfs- 
ticas-resumo e repetido para cada estagio na 
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Saida 5.5 do SPSS Resumo do modelo de regressao 


Model Summary 0 (Resumo do modelo) 


Model 

(Modelo) 

Ft 

Ft Square 
(R 

Quadrado) 

Adjusted 

Ft Square 
(R 

Quadrado 

Ajustado) 

Std. Error 
of the 
Estimate 
(Erro 

Padrao da 
Estimativa) 

Change Statistics (Estatisticas de Mudanjas) 

Durbin- 

Watson 

R Square 
Change 
(Mudanga 
no R 

Quadrado) 

FChange 
(Mudanga 
no F) 

dfl 

(gib 

df2 

(gi2) 

Sig. F. 
Change 
(Mudanga 
na Sig. 
do F) 

1 

2 

0.578 3 

0.815 b 

0.335 

0.665 

0.331 

0.660 

65.9914 

47.0873 

0.335 

0.330 

99.587 

96.447 

1 

2 

198 

196 

0.000 

0.000 

1.950 


a. Previsores: (constante), Verba publicitaria (em milhares de libras). 

b. Previsores: (constante), Verba publicitaria (em milhares de libras), Atratividade da Banda, Numero de execugoes por 
semana na Radio 1. 

c. Variavel dependente: Vendas de discos (em milhares). 


hierarquia. Na Saida do SPSS 5.5, voce deve 
notar que existem dois modelos. O Modelo 
1 se refere ao primeiro estagio da hierarquia 
quando apenas a verba de publicidade e uti- 
lizada como um previsor. O Modelo 2 se re¬ 
fere a quando todos os tres previsores sao 
utilizados. A Saida do SPSS 5.5 e o resumo 
do modelo (model summary) e essa tabela 
foi gerada marcando-se a opgao Model fit 
(Ajustar modelo). Essa opgao e selecionada 
por omissao no SPSS porque ela nos forne- 
ce algumas informagoes importantes sobre o 
modelo: os valores de R, R 2 e o R 2 ajustado. 
Se as opgoes R squared change (Mudangas 
no R quadrado) e Durbin Watson forem sele- 
cionadas, esses valores tambem serao inclui- 
dos (se eles nao forem selecionados, voce 
tera uma tabela menor). 

A tabela resumo e mostrada na Saida do 
SPSS 5.5, e voce notara que ela informa qual 
era a variavel dependente (outcome) e quais 
eram os previsores em cada um dos dois mo¬ 
delos. Na coluna denominada R estao os va¬ 
lores dos coeficientes de correlagao multipla 
entre os previsores e a saida. Quando somente 
a verba de publicidade e utilizada como um 
previsor, existe uma correlagao simples entre 
os valores investidos em publicidade e a venda 
de discos (0,578). Na verdade todas as estatis- 
ticas do modelo 1 sao as mesmas do modelo 
de regressao simples visto anteriormente (Se- 
gao 5.4). A proxima coluna fornece o valor de 
R 2 , que nos ja conhecemos como uma medida 


de quanta variabilidade da saida pode ser de- 
bitada aos previsores. Para o primeiro modelo 
esse valor e 0,335, o que significa que a verba 
de publicidade e responsavel por 33,5% da va- 
riagao nas vendas de discos. Contudo, quando 
os outros dois previsores sao tambem inclui- 
dos (modelo 2), esse valor aumenta para 0,665 
ou 66,5% da variancia na venda de discos. 
Dessa forma, se a publicidade e responsavel 
por 33,5%, podemos verificar que a atrativida¬ 
de e o numero de execugoes sao responsaveis 
por mais 33%. 9 Assim, a inclusao dos dois no- 
vos previsores explicou boa parte da variagao 
das vendas de discos. 

O R 2 ajustado fornece uma nogao de quao 
bem nosso modelo generaliza, e idealmente 
nos gostariamos que esse valor fosse igual 
ao, ou muito proximo do, valor do R 2 . Nes- 
se exemplo, a diferenga para o modelo final e 
pequena (de fato, a diferenga entre os valores 
e 0,665 - 0,660 = 0,005 ou aproximadamente 
0,5%). Isso significa que se o nosso modelo 
fosse derivado da populagao em vez de uma 
amostra, ele explicaria aproximadamente 
0,5% rnenos da variancia da saida. Estudantes 
avangados podem querer aplicar a formula de 
Stein do R 2 para ter uma ideia de quao prova- 
vel seria esse valor entre diferentes amostras. 
A formula de Stein foi apresentada na equagao 


9 Isto e, 33% = 66,5% — 33,5% (esse valor e o R Square 
Change (aiteracao no R quadrado) apresentado na ta¬ 
bela). 
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(5.11) e pode ser aplicada pela substituigao de 
n pelo tamanho da amostra (200) e k com o 
numero de previsores (3): 

R 2 ajustado = 1 — 


U 200-1 \ 

/ 200-2 \ 

/ 200 4-1 Yl 

A 200 — 3 — 1 / 

l 200-3-2/ 

l 200 / 


(1-0,665) 


= 1 - [(1,015)(1,015)(1,005)] 
(0,335) 

= 1-0,347 
= 0,653 

Esse valor e muito semelhante ao valor do 
R 2 observado, de 0,665, indicando que a vali- 
dagao cruzada do modelo e muito boa. 

As estatfsticas de mudanca sao fornecidas 
somente se solicitadas e elas nos informam se 
a mudanga no R 2 e significativa. A significan- 
cia do R 1 pode ser testada utilizando a razao 
F, e esse F e calculado a partir da seguinte 
equacao (na qual N 6 o numero de casos ou 
participantes eteo numero de previsores no 
modelo): 

p _ (N-k-l)R 2 

k(l-R 2 ) 

Na safda do SPSS 5.5, a mudanca nesse F 
e relatada para cada um dos blocos da hierar- 
quia. Assim, o modelo 1 causa uma mudanga 
no R 2 de zero para 0,335, e essa mudanga na 
quantidade de variancia explicada da origem a 
uma razao F de 99,587, que e significativa com 
uma probabilidade menor do que 0,001. Tenha 
em mente que para esse primeiro modelo te- 
mos apenas um previsor (assim, k = 1) e 200 
casos (N = 200). Esse F e obtido da equagao 
anterior: 10 


10 Para obter o mesmo valor que o SPSS, precisamos uti- 
lizar o valor exato do R 2 , que e, 0,3346480676231 (se 
voce nao acredita de um clique duplo na tabela de saida 
do SPSS que apresenta esse valor, depois de um clique 
duplo na celula da tabela contendo o valor do R 1 e voce 
vera que 0,335 toma-se o valor que foi digitado acima!). 


[ Model 1 


(200-1-1)0,334648 

1(1-0,334648) 


99,587 


A adigao de novos previsores (modelo 
2) causa um aumento do R 2 por 0,330 (veja 
acima). Podemos calcular a razao F para essa 
mudanca utilizando a mesma equagao, mas 
porque estamos avaliando as mudangas no 
modelo, utilizaremos essas mu dan gas, R 2 C han _ 
ge , e o R 2 para o novo modelo (modelo 2; nes¬ 
se caso, vamos chama-lo de Rj). Tambem 
usamos a mudanca no numero de previsores, 
^change (° modelo 1 tern um previsor e o mode¬ 
lo 2 tern tres previsores, assim, a mudanca no 
numero de previsores e 3 - 1 = 2), e o numero 
de previsores no novo modelo, k 2 (porque es¬ 
tamos interessados no modelo 2). Novamente, 
se utilizarmos algumas casas decimals a mais 
do que as que a Tabela do SPSS apresenta, ire- 
mos obter aproximadamente a mesma respos- 
ta obtida pelo SPSS: 

p _ (N ~ k 2 — l)Rchange 

Change ~ Wd-^ 2 ) 

(200 —3—1) x 0,330 
2(1-0,664668) 

= 96,44 


Desse modo, a mudanga na variancia 
que pode ser explicada fornece uma razao F 
de 96,44, que e novamente significativo (p < 
0,001). As estatfsticas de mudanga, portanto, 
nos informam sobre as diferengas que ocor- 
rem quando adicionamos novos previsores ao 
modelo. 

Finalmente, se voce solicitou a estatfsti- 
ca de Durbin-Watson, ela sera encontrada na 
ultima coluna da tabela da safda 5.5 do SPSS. 
Essa estatistica nos informa se a hipotese de 
independencia dos erros e satisfeita (veja a 
Segao 5.6.2.1). Como uma regra conserva- 
dora, sugiro que valores menores do que 1 ou 
maiores do que 3 devem, definitivamente, ser 
motivos de preocupagao (embora eu o aconse- 
lhe a determinar valores precisos para a situa- 
gao de interesse). Quanto mais proximo de 2 o 
valor estiver, melhor; para esses dados o valor 
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e 1,950, bem perto de 2, ou seja, a hipotese 
quase com certeza esta satisfeita. 

A safda 5.6 do SPSS mostra a proxima 
parte da safda, que content uma analise de 
variancia (ANOVA) que testa se o modelo e 
significativamente melhor para prever a safda 
do que utilizar a media como um “bom palpi- 
te”. Especificamente, F representa a razao de 
melhoria na previsao que resulta do ajuste do 
modelo em comparagao com a imprecisao que 
ainda existe no modelo. Somos informados do 
valor da soma dos quadrados do modelo (esse 
valor e o SS M da Segao 5.2.3 e representa a 
melhoria na previsao resultante do ajuste de 
uma linha aos dados em vez de utilizar a me¬ 


dia como uma estimativa das safdas). Recebe- 
mos ainda o valor da soma dos quadrados dos 
resfduos (esse valor e o SS R da Segao 5.2.3 e 
representa a diferenga total entre o modelo e os 
dados observados). Somos apresentados ainda 
aos graus de liberdade (gl) para cada termo. 
No caso de melhoria ocasionada pelo mode¬ 
lo, esse valor e igual ao numero de previsores 
(um para o primeiro modelo e tres para o se- 
gundo), e para o SS R ele e o numero de obser- 
vagoes (200) menos o numero de coeficientes 
no modelo de regressao. O primeiro modelo 
tem dois coeficientes (um para a variavel pre- 
visora e outro para a constante), enquanto que 
o segundo tem quatro (um para cada variavel 


Saida 5.6 do SPSS 

ANOVA c (Analise de Variancia) 


Mode / (Modelo) 

Sum of squares 
(Soma dos 
quadrados) 

df 

(gl) 

Mean Square 
(Media dos 
quadrados) 

F 

Sig. 

1 

Regression (Regressao) 

433687.833 

1 

433687.833 

99.587 

0.00 a 


Residual { Res(duo) 

862264.167 

198 

4354.870 




Total (total) 

1295952.0 

199 




2 

Regression (Regressao) 

861377.418 

3 

287125.806 

129.498 

0.00 b 


Residual ( Residuo) 

434574.582 

196 

2217.217 




Total (total) 

1295952.0 

199 





a. Predictors: (Constant), Advertising Budget (thousands of pounds) (Previsores: (constante). Verba publicitaria (em mi- 
Ihares de libras)) 

b. Predictors: (Constant), Advertising Budget (thousands of pounds). Attractiveness of Band, No. of plays on Radio 1 per 
week (Previsores: (constante). Verba publicitaria (em milhares de libras)), Atratividade da Banda, Numero de execugoes 
por semana na Radio 1. 

c. Dependent variable: Record Sales (thousands) (Variavel dependente: Vendas de discos (em milhares)) 


( - ; 

Dica da Samanta Ferrinho 





V. 


O ajuste do modelo de regressao pode ser avaliado utilizando o resumo do mo¬ 
delo (Model Summary) e as tabelas da ANOVA do SPSS. Um exame do R 2 in- 
formara a proporgao da variancia que e explicada pelo modelo. Se voce tiver 
feito uma regressao hierarquica, podera avaliar a melhoria do modelo em cada 
estagio da analise analisando as mudangas no R 2 e se essa mudanga e signifi¬ 
cative (procure por valores menores do que 0,05 na coluna denominada Sig. F 
Change (Mudanga na significance do F)). A ANOVA nos informa tambem se o 
modelo adere de forma significativa aos dados (procure por valores menores 
do que 0,05 na coluna denominada Sig.). Finalmente, existe uma suposigao de 
que os erros na regressao sao independentes; essa suposigao e provavelmente 
satisfeita se a estatistica de Durbin-Watson estiver proxima de 2 (e entre 1 e 3). 
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previsora e um para a constante). Portanto, o 
modelo 1 tem 198 graus de liberdade, ao passo 
que o modelo 2 tem 196. A media da soma dos 
quadrados (MS) e entao calculada para cada 
termo pela divisao do SS pelo gl. A razao F e 
calculada dividindo-se a melhoria no aumen- 
to medio de previsao do modelo (MS m ) pela 
diferenqa media entre o modelo e os dados 
observados (MS R ). Se a melhoria devido ao 
ajuste do modelo de regressao e muito maior 
do que a variacao no interior do modelo, entao 
o valor de F sera maior do que 1 e o SPSS 
calcula a probabilidade exata de obter o valor 
de F por acaso. Para o modelo inicial, a razao 
F 6 99,587, o que e absolutamente improvavel 
de ter acontecido por acaso (p < 0,001). Para 
o segundo modelo, o valor de F e ainda maior 
(129,498), o que e tambem muito significativo 
(p < 0,001). Esses resultados significam que 
o modelo inicial melhorou de forma signifi- 
cativa nossa habilidade de prever um valor da 
variavel de safda, mas o novo modelo (com os 
previsores adicionais) foi ainda melhor (por- 
que o valor de F e ainda mais significativo). 

5.8.3 Parametros do modelo © 

Ate agora verificamos varias estatfsticas 
resumo que nos informam se o modelo me¬ 
lhorou ou nao a nossa habilidade de prever 
valores da variavel de salda. A proxima par¬ 
te da safda esta relacionada com os parame¬ 
tros do modelo. A safda 5.7 do SPSS mostra 
os parametros do modelo para os dois passos 
da hierarquia. O primeiro passo da hierarquia 
foi incluir a verba publicitaria (como foi fei- 
to na regressao simples anteriormente neste 
capftulo) e, assim, os parametros do modelo 
sao identicos aos parametros obtidos na Safda 

5.3 do SPSS. Portanto, estamos interessados 
somente nos parametros do modelo final (no 
qual todos os previsores foram inclufdos). O 
formato das tabelas dos coeficientes depen¬ 
dent das opcoes selecionadas. Os intervalos 
de confian§a para os valores b, o diagnostico 
de colinearidade e as correlates por parte e 
parciais serao apresentadas somente se forem 
selecionas na caixa de dialogo conforme apre- 
sentado na Figura 5.3. 


Lembre que de regressao multipla o mode¬ 
lo toma a forma da equacao (5.9) e nessa equa¬ 
cao existem varias quantidades desconhecidas 
(os valores b ). A primeira parte da tabela apre- 
senta estimativas dos valores b e esses valores 
indicam a contribuiqao individual de cada pre¬ 
visor para o modelo. Se substituirmos os valo¬ 
res b na equacao (5.9) veremos que e possfvel 
definir o modelo como na equacao (5.12): 

Vendas; = b 0 + /qpublicidade, + Tqexecucoes, 
+ Tqatratividade, 

= —26,61 + (0,08publicidade;) 

+ (3,7execu9oes,-) 

+ (ll,09atratividade,) (5.12) 

Os valores b nos informam sobre o re- 
lacionamento entre a venda de discos e cada 
previsor. Se o valor e positivo, podemos dizer 
que existe um relacionamento positivo entre o 
previsor e a safda enquanto que um coeficiente 
negativo representa um relacionamento nega- 
tivo. Para esses dados, todos os tres previsores 
apresentam valores b positivos, indicando re- 
lacionamentos positivos. Assim, a medida que 
a verba publicitaria aumenta, a venda de dis¬ 
cos aumenta; se o numero de executes no ra¬ 
dio aumenta, a venda aumenta, e finalmente se 
a atratividade da banda aumenta, mais discos 
serao vendidos. Os valores b nos informam 
mais do que isso; eles nos informam em que 
grau cada previsor afeta a safda se toclos os 
demais previsores forem mcintidos constantes. 

• Verba publicitaria (Advertising bud¬ 
get) (b = 0,085): Esse valor indica que 
se a verba publicitaria aumentar em uma 
unidade, a venda de discos ira aumentar 
0,085 unidades. Ambas as variaveis foram 
mensuradas em milhares, portanto, para 
cada £1000,00 a mais gastas em publici- 
dade, 0,085 milhares de discos (85 dis¬ 
cos) serao vendidos. Essa interprctaqao e 
verdadeira somente se os efeitos da atrati¬ 
vidade da banda e o numero de execucoes 
forem mantidos constantes. 

• Numero de executes (airplay) (b = 
3,367): Esse valor indica que se o nume¬ 
ro de vezes que o disco toca na radio na 
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Saida 5.7 do SPSS Coeficientes do modelo de regressao 11 


Coeficients a (Coeficientes) 



Unstandardized 

Coefficients 

(Coeficientes 

nao-padronizados) 

Standardized 

Coefficients 

(Coeficientes 

padronizados) 



95% Confidence 
Interval for B 
(Intervalo de Confianga 
de 95% para B) 

Model (Modelo) 

B 

Std. Error 
(Erro 
Padrao) 

Beta 

t 

Sig. 

Lower 

Bond 

(Limite 

Inferior) 

Upper 

bond 

(Limite 

Superior) 

1 (Constant) (Constante) 
Advertising Budget (thou¬ 
sands of pounds) 

134.140 

7.537 


17.799 

0.000 

119.278 

149.002 

(Investimento em Publici- 
dade) (em milhares de 
libras) 

9.612E-02 

0.10 

0.578 

9.979 

0.000 

0.077 

0.115 

2 (Constant) (Constante) 

-26.613 

17.350 


-1.534 

0.127 

-60.830 

7.604 

Advertising Budget (thou¬ 
sands of pounds) (Inves¬ 
timento em Publicidade) 
(em milhares de libras) 

8.488E-02 

0.007 

0.511 

12.261 

0.000 

0.071 

0.099 

No. Of plays on Radio 1 
per week (Numero de 
execugoes na Radio 1 por 
semana) 

3.367 

0.278 

0.512 

12.123 

0.000 

2.820 

3.915 

Attractiveness of Band 
(Atratividade da Banda) 

11.086 

2.438 

0.192 

4.548 

0.000 

6.279 

15.894 


a. Variavel dependente: vendas de discos (em milhares). 


Coeficients a (Coeficientes) 



Correlations 

(Correlagoes) 


Collinearity Statistics 
(Estatisticas de Colinearidade) 

Model (Modelo) 

Zero-order 
(De ordem 
zero) 

Partial 

(Parcial) 

Part 

(Parte) 

Tolerance 

(Tolerancia) 

VIF 

1 Advertising Budget (thousands of 

pounds) (Investimento em Publicidade) (em 
milhares de libras) 

0.578 

0.578 

0.578 

1.000 

1.000 

2 Advertising Budget (thousands of 

pounds) (Investimento em Publicidade) (em 
milhares de libras) 

0.578 

0.659 

0.507 

0.986 

1.015 

No. Of plays on Radio 1 per week (Nume¬ 
ro de execugoes na Radio 1 por semana) 

0.599 

0.655 

0.501 

0.959 

1.043 

Attractiveness of Band (Atratividade da 
Banda) 

0.326 

0.309 

0.188 

0.963 

1.038 


a. Variavel dependente: vendas de discos (em milhares). 


Para poupar sua visao, dividi esta parte da safda em duas 
tabelas; contudo, ela devera aparecer como uma unica e 
longa tabela no visualizador de safdas do SPSS. 
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semana anterior ao langamento aumenta 
em uma unidade, as vendas aumentarao 
3,367 unidades. Dessa forma, cada exe- 
cugao adicional de uma musica no radio 
(na semana anterior ao langamento) e 
associada com uma venda extra de 3,367 
milhares de discos (3367 discos). Essa in- 
terpretagao e verdadeira somente se a ver¬ 
ba publicitaria e a atratividade da banda 
permanecerem constantes. 

• Atratividade (Atractiveness) (b = 11, 
086): Esse valor indica que se a atrativi¬ 
dade da banda aumenta um grau na esca- 
la, entao 11,086 unidades adicionais se- 
rao vendidas. Portanto, cada unidade de 
atratividade da banda esta associada com 
uma venda extra de 11086 discos. Essa 
interpretagao somente sera verdadeira se 
a verba publicitaria e o numero de execu¬ 
tes permanecerem constantes. 

A cada um desses valores [3 esta associa- 
do um erro padrao indicando ate que ponto 
esses valores podem variar entre amostras, e 
esses erros sao utilizados para determinar se 
os valores b diferem significativamente de 
zero. Como visto na Segao 5.2.4, uma esta¬ 
tistica t pode ser associada para testar se um 
valor b e significativamente diferente de zero. 
Na regressao simples, um valor significativo 
de t indica que a inclinagao da linha de regres¬ 
sao e significativamente diferente de uma li¬ 
nha horizontal, mas na regressao multipla, nao 
e facil vislumbrar o que o valor nos informa. 
E facil conceituar o teste t como uma medida 
que informa se o previsor esta contribuindo de 
forma significativa para o modelo. Portanto, 
se o teste t associado com um valor b e signifi¬ 
cativo (se o valor rotulado como Sig. e menor 
do que 0,05), entao o previsor esta fazendo 
uma contribuigao significativa para o mode¬ 
lo. Quanto menor for o valor da Sig. (e maior 
o valor de t), maior sera a probabilidade de 
essa contribuigao ocorrer. Para esse modelo, a 
verba publicitaria (r( 196) = 12,26 ,p< 0,001), 
a quantidade de execugoes na radio antes do 
langamento (f(196) = 12,12, p < 0,001) e a 
atratividade da banda (f(196) = 4,55, p < 
0,001) sao todos previsores significativos para 


a venda de discos. 12 A partir da magnitude da 
estatistica 1 podemos ver que a verba publici¬ 
taria e o numero de execugoes tem impactos 
semelhantes, enquanto que a atratividade da 
banda tem um impacto menor. 

Os valores b e suas significances sao es- 
tatlsticas importantes; contudo, as versoes pa- 
dronizadas dos valores b sao mais faceis de in¬ 
terpretar (porque elas nao sao dependentes das 
unidades de medida das variaveis). Os valores 
padronizados de beta sao tambem fornecidos 
pelo SPSS (denominados Beta, /},) e eles nos 
apresentam o numero de desvios padrao que a 
salda ira mudar como resultado de uma altera- 
gao de um desvio padrao no respectivo previ¬ 
sor. Os valores [3 padronizados sao todos men- 
surados em termos de unidades desvios padrao 
e sao, dessa forma, comparaveis diretamente; 
portanto, eles fornecem uma ideia melhor da 
“importancia” de um previsor para o modelo. 
Os valores [3 padronizados para as execugoes e 
a verba publicitaria sao praticamente identicos 
(0,512 e 0,511, respectivamente), indicando 
que as duas variaveis apresentam um grau de 
importance comparavel para o modelo (isso 
concorda com a magnitude da estatistica r) 13 . 
Para interpretar literalmente esses valores, pre- 
cisamos saber os desvios padrao de todas as 
variaveis e esses valores podem ser encontra- 
dos na Saida 5.4 do SPSS. 

• Verba publicitaria (Advertising bud¬ 
get) (ft padronizado = 0,511): Esse valor 
indica que se a verba publicitaria aumen- 
tar em um desvio padrao (£485655), a 


12 Para todos os previsores escrevi t( 196). O numero nos 
parenteses e o grau de liberdade. Vimos na Setjao 5.2.4 
que na regressao os graus de liberdade sao N — p — 1, 
onde N 6 o tamanho da amostra (nesse caso, 200) e p 
e o numero de previsores (nesse caso, tres). Para esses 
dados, obtemos 200 - 3 - 1 = 196. 

13 A estatistica t 6 comparavel ao valor beta padroniza¬ 
do porque ela e obtida por meio da divisao pelo erro 
padrao e, dessa forma, representa a versao estudenti- 
zada dos valores beta. Os valores beta padronizados 
sao calculados dividindo-se pelo desvio padrao. No 
Capitulo 1, vimos que o desvio padrao e o erro padrao 
estao intimamente relacionados: portanto, estatisticas 
padronizadas e estudentizadas sao, de certa maneira, 
comparaveis. 
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venda de discos ira aumentar 0,511 des- 
vios padrao. O desvio padrao da venda 
de discos e 80699 e, assim, teremos uma 
mudan§a de 41240 vendas (0,511.80699). 
Portanto, para cada £485655 a mais gasto 
em publicidade, uma venda extra de dis¬ 
cos de 41240 unidades sera obtida. Essa 
interpreta 9 ao e verdadeira somente se os 
efeitos da atratividade da banda e o niime- 
ro de execu 95 es no radio permanecerem 
constantes. 

• Numero de execu 9 oes (airplay) (ft pa- 

dronizado = 0,512): Esse valor indica que 
se o numero de vezes que o disco toca na 
radio na semana anterior ao lan 9 amento 
aumenta em um desvio padrao (12,27), 
as vendas aumentarao em 0,512 desvios 
padrao. O desvio padrao da venda de dis¬ 
cos e 80699 e, desse modo, uma mudan- 
9 a de 41320 nas vendas podera ocorrer 
(0,512.80699). Portanto, se a Radio 1 toca 
a musica um numero extra de 12,27 vezes 
na semana anterior ao lan 9 amento, uma 
venda extra de 41320 discos e esperada. 
Essa interpreta 9 ao e verdadeira somente 
se a verba publicitaria e a atratividade da 
banda permanecerem constantes. 

• Atratividade (Atractiveness) ((/? padro- 
nizado = 0,192): Esse valor indica que 
se a atratividade da banda aumenta um 
desvio padrao (1,40 unidades), pode-se 
esperar 0,192 desvios padrao de unidades 
adicionais vendidas. Isso representa uma 
mudan 9 a de 15490 discos (0,192.80699). 
Portanto, uma banda com uma atrativida¬ 
de 1,40 superior a outra banda pode espe¬ 
rar uma venda adicional de 15490 discos. 
Essa interpreta 9 ao somente sera verdadei¬ 
ra se a verba publicitaria e o numero de 
execu 95 es permanecerem constantes. 

Imagine que coletamos 100 amostras de 
dados e mensuramos as mesmas variaveis do 
nosso modelo atual. Para cada amostra, po- 
demos criar um modelo de regressao para re- 
presentar os dados. Se o modelo e fidedigno, 
esperamos encontrar parametros bastante se- 
melhantes em ambos. Portanto, cada amostra 
deve produzir aproximadamente os mesmos 


valores b. O intervalo de confian 9 a para os 
valores (3 nao-padronizados sao limites cons- 
trufdos tais que em 95% dessas amostras esses 
limites irao conter os verdadeiros valores de b 
(veja a Se 9 ao 1.6.2). Portanto, se tivermos co- 
letado 100 amostras e calculado os intervalos 
de confian 9 a para b, diremos que temos uma 
confian 9 a de 95% de que esses intervalos con- 
terao os verdadeiros valores dos coeficientes 
b. Assim, podemos garantir que o intervalo de 
confian 9 a que construfmos para essas amos¬ 
tras contera o verdadeiro valor de b popula- 
cional. Isso acontecendo, um bom modelo 
apresentara intervalos de confian 9 a pequenos, 
indicando que os valores de b nessa amostra 
estao proximos do verdadeiro valor de b na 
popula 9 ao. O sinal (positivo ou negativo) dos 
valores b nos informa sobre a dire 9 ao do re- 
lacionamento entre o previsor e o resultado. 
Desse modo, podemos esperar que um mode¬ 
lo rnuito ruim apresente intervalos contendo 
o zero, indicando que em algumas amostras o 
previsor tern um relacionamento positivo com 
o resultado, ao passo que em outras ele tem 
um relacionamento positivo. Nesse modelo, os 
dois melhores previsores (verba publicitaria e 
numero de execu 95 es) apresentam intervalos 
bastante estreitos, indicando que as estima- 
tivas para o modelo atual sao provavelmente 
representativas dos valores populacionais. O 
intervalo para a atratividade e mais largo (mas 
ainda nao content o zero), indicando que o pa- 
rametro para essa variavel e menos represen¬ 
tative, mas ainda assim significativo. 

Se voce solicitou as correla 9 oes por parte 
(ou parciais), elas irao aparecer na safda em 
colunas separadas da tabela. As correla 9 oes de 
ordem zero sao os coeficientes de correla 9 ao 
simples de Pearson (e correspondem aos va¬ 
lores na Safda 5.4 do SPSS). As correla 9 oes 
parciais representam o relacionamento entre 
cada previsor e a variavel de safda, controla- 
dos os efeitos dos demais previsores. A corre- 
la 9 ao por partes representa o relacionamento 
entre cada previsor e a safda, controlado o 
efeito que as outras duas variaveis apresentam 
na variavel de safda. De fato, essas correla- 
9 oes por partes representam o relacionamento 
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V 


A contribuigao individual de cada variavel para o modelo de regressao pode ser 
encontrada na tabela dos coeficientes do SPSS. Se voce fez uma regressao hie- 
rarquica, olhe para os valores do modelo final. Voce pode ver se cada variavel pre- 
visora fez uma contribuigao significativa para prever o resultado olhando para a 
coluna rotulada como Sig. (valores menores do que 0,05 sao significativos). Voce 
deve tambem observar os valores (3 padronizados porque eles informam sobre a 
importancia de cada previsor (quanto maior o valor absoluto, melhor). Os valores 
da tolerancia e do FIV tambem serao uteis mais tarde, portanto, tome nota deles! 


unico que cada previsor tem com a variavel 
de saida. Se voce optar por executar uma re¬ 
gressao passo a passo (stepwise), vera que a 
variavel da entrada e baseada inicialmente 
na variavel com a maior correlacao de ordem 
zero e depois com a correlaqao por parte com 
as variaveis restantes. Portanto, o niimcro de 
execucoes sera adicionado primeiro (em vir- 
tude da maior correlacao de ordem zero), de¬ 
pois a verba publicitaria (porque sua correla- 
cao por partes e maior do que a atratividade) e 
finalmente a atratividade. Tente executar uma 
regressao passo a passo para frente (forward 
stepwise) nesses dados para ver se eu estou 
certo! Finalmente, iremos fornecer detalhes 
sobre as estatfsticas de colinearidade, mas elas 
serao discutidas na Secao 5.8.5. 


5.8.4 Variaveis excluidas © 

A cada estagio da analise de regressao, o 
SPSS fornece um resumo de qualquer variavel 
que ainda nao foi adicionada ao modelo. No 
modelo hierarquico, esse resumo apresenta 
detalhes das variaveis que foram especificadas 
para entrar no modelo em passos subsequen- 
tes, e na regressao passo a passo essa tabela 
(Saida 5.8 do SPSS) content resumos das va¬ 
riaveis que o SPSS determinou que devem en¬ 
trar no modelo. Para esse exemplo, existe um 
resumo das variaveis excluidas no primeiro 
estagio da hierarquia (nao existe resumo para 
o segundo estagio porque todos os previsores 
estao no modelo). O resumo fornece uma es- 
timativa de cada valor beta do previsor se ele 
entrar na cquaqao nesse ponto e fornece um 


Saida 5.8 do SPSS 


Excluded Variables ' 1 (Variaveis Excluidas) 







Collinearity Statistics 
(Estatfsticas de Colinearidade) 

Model (Modelo) 

Beta 

In 

t 

Sig. 

Partial 

Correlations 

(Correlagoes) 

Tolerance 

(Tolerancia) 

FIV 

Minimum 

Tolerance 

(Tolerancia 

Minima) 

1 No. Of plays on Radio 7 
per week (Numero de 
execuQoes na Radio 1 por 
semana) 

0.546“ 

12.513 

0.000 

0.665 

0.990 

1.010 

0.990 

Attractiveness of Band (Atrati¬ 
vidade da Banda) 

0.281“ 

5.136 

0.000 

0.344 

0.993 

1.007 

0.993 


a. Previsores no modelo: (constante), Verba publicitaria (em milhares de libras). 

b. Variavel dependente: Venda de discos (em milhares). 
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teste t para esse valor. Na regressao passo a 
passo (stepwise), o SPSS entra o previsor com 
a estatfstica t mais alta e continua entrando 
previsores ate que nao reste nenhum com es¬ 
tatfstica t que tenha valor significativo inferior 
a 0,05. A correlagao parcial tambem fornece 
algumas indicates sobre qual ccntribuigao 
(se existir alguma) um previsor exclufdo faria 
se ele tivesse entrado no modelo. 

5.8.5 Avaliando as hipoteses de 
nao-multicolinearidade © 

A Safda 5.7 do SPSS fornece algumas me- 
didas para verificar a colinearidade nos dados. 
Especificamente, ela fornece as estatfsticas FIV 
e tolerancia (com a tolerancia sendo 1 dividido 
pela FIV). Existem algumas observacoes da 
Segao 5.6.2.3 que podem ser aplicadas aqui: 

• Se a maior FIV for maior do que 10, entao 
existe motivo para preocupagao (Myers, 
1990; Bowerman e O’Connell. 1990). 

• Se a FIV media e substancialmente maior 
do que 1, entao a regressao pode ser 
tendenciosa (Bowerman e O’Connell, 
1990). 

• Tolerancia abaixo de 0,10 indica proble- 
mas serios. 

• Tolerancia acima de 0,20 indica um pro- 
blema em potencial (Menard, 1995). 


Para o modelo atual, os valores FIV es- 
tao todos abaixo de 10 e as tolerancias todas 
acima de 0,20; portanto, podemos concluir 
com seguranca que nao existe colinearidade 
dentro dos nossos dados. Para calcular a FIV 
media, simplesmente adicionamos os valores 
para cada previsor e dividimos pelo numero 
de previsores ( k ): 

k 

— § nV; 1,015 + 1,043 + 1,038 

FIV= —-=- 

k 3 

= 1,032 

A FIV media esta muito proxima de 1 e 
confirma que a colinearidade nao e um proble- 
ma para esse modelo. O SPSS tambem produz 
uma tabela de autovalores da matriz dos produ- 
tos cruzados, indices de condigao e proporgao 
de variancias. Existe uma longa discussao, e um 
exemplo, sobre colinearidade na Segao 6.8 e e 
apresentada a forma como detecta-la utilizan- 
do proporgoes de variancias. Portanto, vou me 
limitar agora em dizer que procuraremos por 
grandes proporgoes de variancias em um mes- 
mo pequeno autovalor. Assim, na safda 5.9 do 
SPSS olhamos para as ultimas linhas inferiores 
da tabela (esses sao os pequenos autovalores) e 
procuramos por variaveis que tenham propor¬ 
goes de alta variancia para esse autovalor. As 


Safda 5.9 do SPSS 


Collinearity Diagnostics 3 (Diagnosticos de Colinearidade) 


Model 

(Modelo) 

Dimension 

(Dimensao) 

Eingenva/ue 

(Autovalor) 

Condition 
index 
(Indice de 
Condigao) 

Variance Proportions (Proporgoes da Variancia) 

(Constant) 

(Constante) 

Advertising 
Budget 
(thousands of 
pounds) (Verba 
publicitaria 
(em milhares 
de libras)) 

No. Of plays 
on Radio 1 
per week 
(Execugoes 
na Radio 1 
por semana) 

Attractiveness 
of Band 
(Atratividade 
da Banda) 

i 

i 

1.785 

1.000 

0.11 

0.11 




2 

0.215 

2.883 

0.89 

0.89 



2 

1 

3.562 

1.000 

0.00 

0.02 

0.01 

0.00 


2 

0.308 

3.401 

0.01 

0.96 

0.05 

0.01 


3 

0.109 

5.704 

0.05 

0.02 

0.93 

0.07 


4 

2.039E-02 

13.219 

0.94 

0.00 

0.00 

0.92 


a. Dependent Variable: Record Sales (thousands) (Variavel dependente: Venda de discos (em milhares)) 
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proposes de variancias variam entre 0 e 1 e 
para cada previsor deve estar distribufda entre 
as diferentes dimensoes (ou autovalores). Para 
esse modelo, voce podera ver que cada previsor 
tem a maioria de suas variancias em dimensoes 
diferentes (a verba publicitaria tem 96% da va¬ 
riancia na dimensao 2, o numero de cxecucoes 


tem 93% da variancia na dimensao 3 e a atra- 
tividade da banda tem 92% da variancia na di¬ 
mensao 4). Esses dados representam o exemplo 
classico de multicolinearidade. Para um exem¬ 
plo de quando a colinearidade existe nos dados 
e algumas sugestoes sobre o que pode ser feito, 
veja os Capitulos 5 e 11 (Segao 6.8). 
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A 



Para checar as hipoteses de inexistencia de multicolinearidade, use os valores 
FIV da tabela denominada Coeficientes (Coefficients) na saida do SPSS. Se es¬ 
ses valores forem menores do que 10, provavelmente nao ha motivo de preocu- 
pagao. Se o valor medio da VIF e nao for substancialmente maior do que 1, isso 
tambem indica que nao ha motivos para alarme. 



Quadro 5.2 


O que sao autovalores e autovetores @ 

As definigoes e a matematica dos autovalores e autovetores sao bastante 
complicadas e geralmente nao precisamos nos preocupar com elas (embora eles 
surjam novamente nos Capitulos 14 e 15). Contudo, embora a matematica envol- 
vida seja dificil, ela e facil de visualizar! Imagine que temos duas variaveis: o sala- 
rio anual de uma supermodelo e quao bela ela e. Imagine, ainda, que essas duas 
variaveis sao normalmente distribuidas e, portanto, podem ser considerados em 
conjunto como uma distribuigao normal bivariada. Se essas variaveis estiverem correlacionadas, o 
diagrama de dispersao forma uma elipse. Isso e mostrado nos diagramas de dispersao abaixo: se 
tragarmos uma linha pontilhada ao redor dos valores superiores do diagrama, obteremos algo de 
forma oval. Agora, podemos tragar duas linhas para medir o comprimento e a largura da elipse. 
Essas linhas sao os autovetores da matriz de correlagao original para essas variaveis (um vetor e 
apenas um conjunto de numeros que nos informa a localizagao de uma linha no espago geometri- 
co). Observe que as duas linhas tragadas (uma para a largura e outra para o comprimento da oval) 
sao perpendiculares, isto e, elas formam um angulo de 90 graus, o que significa que elas sao inde- 
pendentes uma da outra. Assim, com duas variaveis, autovetores sao apenas linhas medindo o 
comprimento e a largura da elipse ao redor do diagrama de dispersao dos dados para essas varia¬ 
veis. Se adicionarmos uma terceira variavel (por exemplo, a experiencia da supermodelo), o dia¬ 
grama de dispersao obtem uma terceira dimensao, a elipse torna-se algo com a forma de uma bola 
de rugbi (ou de futebol americano), e porque adicionamos a terceira dimensao (comprimento, lar¬ 
gura e altura), ganhamos um terceiro autovetor que mede a dimensao extra. 

Se adicionarmos uma quarta variavel, uma logica semelhante e aplicada (embora seja mais 
dificil visualiza-la): obtemos uma dimensao extra e um autovetor para medir essa dimensao. 
Agora, cada autovetor tem um autovalor que nos informa seu comprimento (isto e, a distancia 
de um ponto (inicio ) a outro (final) do autovetor). Assim, examinando todos os autovetores de 
um conjunto de dados, sabemos as dimensoes da elipse ou bola de rugbi; ou seja, nos sabemos 
as dimensoes dos dados. Portanto, os autovetores mostram quao equitativamente as variancias 
da matriz estao distribuidas. 

[Continua) 
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Quadro 5.2 (Continuagao) 




Beleza 


Beleza 


No caso de duas variaveis, a condigao dos dados e relacionada a razao entre o tamanho do 
maior autovalor pelo do menor. Vamos olhar para os dois extremos: quando nao existe relacio- 
namento entre as variaveis e quando existe um relacionamento perfeito. Quando nao existe re- 
lacionamento, o diagrama de dispersao ira estar mais ou menos contido em uma circunferencia 
(ou em uma esfera, se tivermos tres variaveis). Se novamente tragarmos linhas que medem o 
comprimento e a largura do circulo, veremos que elas apresentam o mesmo valor. Os autovalo- 
res medem o comprimento; portanto, os autovalores serao os mesmos. Assim, quando dividir- 
mos o comprimento do maior autovalor pelo menor, obteremos 1 (porque os autovalores sao 
os mesmos). Quando as variaveis sao perfeitamente correlacionadas (isto e, existe uma 
colinearidade perfeita), o diagrama de dispersao forma uma linha reta e a elipse ao 
redor sera muito estreita (com largura proxima de zero). Consequentemente, 
quando dividirmos o maior autovetor pelo menor, iremos obter um valor que 
tende para o infinito (porque o menor autovalor esta proximo de zero.) Dessa 
forma, um indice de condigao infinito e sinal de um grande problema. 


M 10 



</) c 


w o 



5.8.6 Diagnostics por casos 
(Casewise) © 

O SPSS produz uma tabela resumo de es- 
tatisticas residuais e elas devem ser examinadas 
para casos extremos. A Saida 5.10 do SPSS 
mostra casos com um resfduo padronizado me¬ 
nor que —2 ou maior do que 2 (lembre que mu- 


damos o criterio padrao de 3 para 2 na Figura 
5.13). Mencionei na Segao 5.6.1.1 que em uma 
amostra comum esperamos que 95% dos casos 
tenham restduos padronizados dentro de ±2. 
Nos temos uma amostra de 200, assim, e razoa- 
vel esperar que aproximadamente 10 casos (5%) 
tenham restduos padronizados fora desses limi- 
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Saida 5.10 do SPSS 


Casewise Diagnostics a (Diagnosticos caso a caso) 


Case number 
(Caso numero) 

Std. Residual 
(Residuo Padronizado) 

Record Sales (thousands) 
(Vendas de discos (milhares)) 

Predicted value 
(Valor previsto) 

Residual 

(Residuo) 

i 

2.125 

330.00 

229.9203 

100.0797 

2 

-2.314 

120.00 

228.9490 

- 108.9490 

10 

2.114 

300.00 

200.4662 

99.5338 

47 

- 2.442 

40.00 

154.9698 

- 114.9698 

52 

2.069 

190.00 

92.5973 

97.4027 

55 

- 2.424 

190.00 

304.1231 

- 114.1231 

61 

2.098 

300.00 

201.1897 

98.8103 

68 

- 2.345 

70.00 

180.4156 

- 110.4156 

100 

2.066 

250.00 

152.7133 

97.2867 

164 

-2.577 

120.00 

241.3240 

- 121.3240 

169 

3.061 

360.00 

215.8675 

144.1325 

200 

-2.064 

110.00 

207.2061 

-97.2061 


a. Dependent variable: Record Sales (thousands) (Variavel dependente: vendas de discos (em milhares)) 


tes. Da Saida 5.10 do SPSS podemos ver que 
temos 12 casos (6%) que estao fora dos limites: 
portanto, nossa amostra esta 1% alem do que 
esperavamos. Alem disso, 99% dos casos de- 
vem estar entre ±2,5 e, desse modo, esperamos 
apenas 1% dos casos fora desses limites. A par- 
tir dos casos listados aqui ficou claro que dois 
casos (1%) estao fora dos limites (casos 164 e 
169). Portanto, nossa amostra parece se ajustar 
ao que esperariamos de um modelo bastante 
preciso. Esses diagnosticos nos informam que 
nao existe um motivo real de preocupagao exce- 
to pelo fato do caso 169 ter residuo padronizado 
acima de 3, provavelmente grande o suficiente 
para merecer uma investigagao adicional. 

Lembre que na Segao 5.7.4 solicitamos 
que o SPSS salvasse varias estatfsticas de 
diagnostico. Voce deve verificar que o edi¬ 
tor de dados content agora colunas para essas 
variaveis. E perfeitamente aceitavel checar 
esses valores no editor de dados, mas voce 
tambem pode fazer com que o SPSS liste os 
valores na janela de visualizacao. Para listar 
essas variaveis, voce precisa utilizar o coman- 
do Case Summaries (Resumo de casos), que 
pode ser encontrado pela utilizacao do cami- 
nho Analyzes Regorts=> Case Summaries ... 
(Analisar=>Relatorio=>Casos Resumos... ). 14 A 


14 Statistics^ Summarizes Case Summaries... (Esta- 
tfstica=>Resumir=>Resumo de Casos) na versao 8.0 e 
anteriores. 


Figura 5.17 mostra a caixa de dialogo para essa 
fungao. Selecione as variaveis que voce quer 
listar e transfira-as para o painel denomina- 
do Variables (Variaveis) clicando em _lJ. Por 
ontissao, o SPSS ira limitar a safda aos primei- 
ros 100 casos, mas se voce quiser listar todos os 
seus casos, basta retirar a selecao dessa opcao. 
E tambem muito importante selecionar a opcao 
Show case numbers (Mostrar numero dos ca¬ 
sos) porque de outro modo talvez voce nao seja 
capaz de identificar um caso problematico. 

Uma estrategia util e utilizar o diagnosti¬ 
co caso a caso para identificar situagoes que 
merecem uma analise mais detalhada. Assim, 
para economizar espago, criei uma variavel 
codigo (1 = inclui, 0 = exclui), de modo que 
pude identificar os 12 casos listados na Safda 
5.11 do SPSS em um grupo e todos os demais 
em outro. Utilizando essa variavel codigo e 
especificando-a como uma variavel de agru- 
pamento na caixa de dialogo summarize cases 
(resumo de casos), pude olhar os 12 casos em 
conjunto e descartar todos os outros. 

A Safda 5.11 do SPSS mostra as estatfs¬ 
ticas de influencia para os 12 casos que se- 
lecionei. Nenhuma delas tern a distancia de 
Cook maior do que 1 (mesmo o caso 169 esta 
bem abaixo desse criterio) e, assim, nenhum 
desses casos ira influenciar indevidamente o 
modelo. A influencia media pode ser calcu- 
lada como 0,02 = (k + 1 hi) = 4/200 e, desse 
modo, iremos procurar por casos com valo- 
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Figura 5.17 


res duas (0,04) ou tres vezes (0,06) maiores 
dependendo em qual estatistico voce acredita 
mais (veja a Se^ao 5.6.1.2)! Todos os casos 
estao dentro dos limites de tres vezes a media 
e somente o caso 1 esta proximo de duas ve¬ 
zes a media. Finalmente, das recomenda95es 
para a distancia de Mahalanobis, vimos que 


para uma amostra de 100 com tres previso- 
res, valores maiores do que 15 seriam proble- 
maticos. Temos tres previsores e uma grande 
amostra, assim, esse valor sera um ponto de 
corte bem conservador, ja que nenhum dos 
nossos casos esta proximo de exceder esse 
criterio. A evidencia sugere que nao existem 


Saida 5.11 do SPSS 


Case Summaries (Resumo de Casos) 



Case 

number 

(Caso 

numero) 

Standardized 
DFBETA 
Intercept 
(Intercepto 
do DFBETA 
padronizado) 

Standardized 

DFBETA 

ADVERTS 

(PUBLICIDADE 

DFBETA 

padronizada) 

Standardized 

DFBETA 

AIRPLAY 

(EXECUQOES 

DFBETA 

padronizadas) 

Standardized 

DFBETA 

ATTRACT 

(ATRATIVIDADE 

DFBETA 

padronizada) 

Standardized 

DFFIT 

(DFFIT 

padronizado) 

COVRATIO 

1 

i 

- 0.31554 

-0.24235 

0.15774 

0.35329 

0.48929 

0.97127 

2 

2 

0.01259 

-0.12637 

0.00942 

-0.01868 

-0.21110 

-0.92018 

3 

10 

-0.01256 

-0.15612 

0.16772 

0.00672 

0.26896 

0.94392 

4 

47 

0.06645 

0.19602 

0.04829 

-0.17857 

-0.31469 

0.91458 

5 

52 

0.35291 

0.02881 

-0.13667 

-0.26965 

0.36742 

0.95995 

6 

55 

0.17427 

0.32649 

-0.02307 

-0.12435 

-0.40736 

0.92486 

7 

61 

0.00082 

-0.01539 

0.02793 

0.02054 

0.15562 

0.93654 

8 

68 

-0.00281 

0.21146 

-0.14766 

-0.01760 

-0.30216 

0.92370 

9 

100 

0.06113 

0.14523 

-0.29984 

0.06766 

0.35732 

0.95888 

10 

164 

0.17983 

0.28988 

-0.40088 

-0.11706 

-0.54029 

0.92037 

11 

169 

-0.16819 

-0.25765 

0.25739 

0.16968 

0.46132 

0.85325 

12 

200 

0.16633 

-0.04639 

0.14213 

-0.25907 

-0.31985 

0.95435 

Total N 


12 

12 

12 

12 

12 

12 


(Continua) 
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Case Summaries (Resumo de Casos) 



Case number 
(Caso numero) 

Cook's Distance 
(Distancia de Cook) 

Mahalanobis Distance 
(Distancia de 
Mahalanobis) 

Centered Leverage Value 
(Valor da Influencia 
Centrado) 

1 

i 

0.05870 

8.39591 

0.04219 

2 

2 

0.01089 

0.59830 

0.00301 

3 

10 

0.01776 

2.07154 

0.01041 

4 

47 

0.02412 

2.12475 

0.01068 

5 

52 

0.03316 

4.81841 

0.02421 

6 

55 

0.04042 

4.19960 

0.02110 

7 

61 

0.00595 

0.06880 

0.00035 

8 

68 

0.02229 

2.13106 

0.01071 

9 

100 

0.03136 

4.53310 

0.02278 

10 

164 

0.07077 

6.83538 

0.03435 

11 

169 

0.05087 

3.14841 

0.01582 

12 

200 

0.02513 

3.49043 

0.01754 

Total N 


12 

12 

12 


casos que podem influenciar nos nossos da¬ 
dos (embora todos os casos tenham que ser 
examinados para confirmar esse fato). 

Podemos tambem examinar a estatistica 
DFBeta para ver se algum caso tem uma gran¬ 
de influencia nos parametros de regressao. Um 
valor absoluto maior do que 1 sera um proble- 
ma e em todos os casos os valores estao en- 
tre ±1, o que mostra que esses casos nao tem 


influencia indevida sobre os parametros de 
regressao. Existe tambem uma coluna para a 
razao de covariancias. Vimos na Segao 5.6.1.2 
que precisamos utilizar o seguinte criterio: 

• CVR, > 1 + [3a + 1 )/n] = 1 + [3(3 + 
l)/200] = 1,06. 

• CVR ; < 1 - [3(/t + 1)/«] = 1 - [3(3 + 
l)/200] = 0,94. 


c~ ~~~~ —— 

Dica da Samanta Ferrinho 


>V 



V. 


Voce precisa procurar casos que possam influenciar o modelo de regressao. 

• Verifique os residuos padronizados e confirme que nao mais do que 5% dos 
casos apresentam valores absolutos acima de 2 e nao mais do que 1% apre- 
sentam valores absolutos acima de 2,5. Qualquer caso com valor acima de 3 
sera um valor atipico. 

• Olhe no editor de dados as distancias de Cook: qualquer valor acima de 1 
indica um caso que podera influenciar o modelo. 

• Calcule a influencia media (o numero de previsores mais 1 dividido pelo tama- 
nho da amostra) e entao observe valores maiores do que duas ou tres vezes 
a influencia media. 

• Para a distancia de Mahalanobis, uma verificagao rapida e procurar valores 
acima de 25 em amostras grandes (500) e valores acima de 15 em amostras 
pequenas (100). Contudo, Barnett e Lewis (1978) devem ser consultados para 
uma analise mais detalhada. 

• Procure valores com DFBeta maiores do que 1. 

• Calcule os limites superior e inferior dos valores aceitaveis para a razao de 
covariancias, CVR. O limite superior e 1 mais tres vezes a influencia media, 
enquanto que o limite inferior e 1 menos tres vezes a influencia media. Casos 
que apresentam um CVR fora desses limites podem ser problematicos. 
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Portanto, estamos procurando por casos 
que se desviem substancialmente desses limites. 
Muitos dos nossos 12 valores atlpicos potenciais 
apresentam valores CVR dentro ou proximo 
desses limites. O unico caso que pode preocupar 
e o 169 (novamente!), cujo CVR esta de alguma 
forma abaixo do limite inferior. Contudo, verifi- 
cando a distancia de Cook para esse caso, prova- 
velmente nao ha motivo para preocupagao. 

Se voce tivesse solicitado outras estatls- 
ticas de diagnostico e com o que voce ja sabe 
de discussoes anteriores sobre elas, voce sabe- 
ria que deve analisa-las na situacao de casos 
nao usuais nos dados. Contudo, a partir desse 
conjunto mlnirno de diagnostico parece que 
temos um modelo razoavelmente confiavel 
que nao tem sido influenciado por qualquer 
subconjunto de casos. 


5.8.7 Conferindo as hipoteses © 

Para finalizar a analise, voce deve verificar 
as hipoteses do modelo. Ja checamos a colinea- 
ridade dentro dos dados e utilizamos a estatistica 
de Durbin-Watson para verificar se os reslduos 
no modelo sao independentes. Na Segao 5.7.3, 
solicitamos um grafico dos *ZRESID contra 
*ZPRED e um histograma e um diagrama das 
probabilidades normais dos reslduos. O grafico 
do *ZRESID e *ZPRED deve ser semelhante a 
um conjunto aleatorio de pontos dispersos em 
tomo de zero. Se esse grafico afunila, e provavel 
que os dados sejam heterocedasticos. Se existir 
qualquer tipo de curva nesse grafico, as chances 
sao de que esses dados nao satisfazem a hipote- 
se de linearidade. A Figura 5.18 mostra varios 
exemplos de graficos dos reslduos padroniza- 



Valores previstos da regressao padronizados 



Valores previstos da regressao padronizados 



Figura 5.18 Diagramas dos *ZREDID contra *ZPRED. 







Prob. Acumulada esperada Frequences 
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dos contra os valores previstos padronizados. O 
painel (a) mostra o grafico do nosso exemplo 
da venda de discos. Note como os pontos estao 
aleatoriamente dispersos por todo o quadrante. 
Esse padrao e um indicativo da situagao em que 
as suposigoes de linearidade e homocedastici- 
dade foram satisfeitas. O painel (b) mostra um 
diagrama semelhante para um conjunto de da¬ 
dos que viola a hipotese de homocedasticida- 
de. Note que os pontos se espalham como uma 
forma de fund ficando cada vez mais distantes 
entre si a medida que os dados avangam para 
a direita. Essa e a forma tfpica da heterocedas- 
ticidade e indica um crescimento da variancia 
nos resfduos. O painel (c) mostra um diagrama 
de dados que nao tem um relacionamento linear 
entre os previsores e a variavel de safda. Esse 
padrao e mostrado pelos resfduos. Uma linha 


ilustrando a relagao nao-linear foi desenhada 
sobre o grafico destacando a tendencia dos da¬ 
dos. Finalmente, o painel (d) representa uma si¬ 
tuagao na qual os dados nao apenas apresentam 
um relacionamento nao-linear, mas tambem he- 
terocedasticidade. Note inicialmente que num 
canto do diagrama os pontos estao bem proxi- 
mos, mas na outro eles estao bem separados. 
Quando essas suposigoes nao forem satisfeitas 
voce nao ira ver exatamente esses padroes, mas 
espero que esses diagramas o ajude a entender 
os tipos de anomalias que voce deve procurar. 

Para testar a normalidade dos resfduos, de- 
vemos olhar para os histogramas e o diagrama 
de probabilidades normais selecionados na Fi- 
gura 5.14. A Figure 5.19 mostra o histograma 
e o diagrama das probabilidades normais dos 
dados para o exemplo atual (lado esquerdo). O 


Saida: Vendas de disco (em milhares) 



Desvio Padrao = 0,99 
Media = 0,00 
N = 200 


Resfduos Padronizados da Regressao 



Resfduos Padronizados da Regressao 


Desvio Padrao 
= 1,00 

Media = 58,1 
N = 100 


Saida: Vendas de disco (em milhares) 



Saida 



Probabilidade acumulada observada 


Figura 5.19 Histogramas e diagramas P-P dos residuos normalmente distribuidos (lado esquer¬ 
do) e residuos nao normalmente distribuidos (lado direito). 


























Vendas de disco (em milhares) 


210 Andy Field 


histograma deve ser parecido ao de uma distri- 
buieao norma. O SPSS desenha a curva sobre o 
histograma para mostrar a forma da distribui- 
Cao. Para os dados da gravadora, a distribuicao 
e aproximadamente normal (embora exista 
uma leve deficiencia dos resfduos exatamente 
em zero). Compare esse histograma com o que 
esta ao lado dele, extremamente nao-normal, e 
deve ficar claro que a distribuicao nao-normal 
apresenta uma assimetria acentuada. Assim, 
voce deve procurar curvas que tenham a mes- 
ma forma que essa dos dados da venda de dis¬ 
cos: qualquer desvio dessa curva e um sinal de 
nao-normalidade e quanto maior a diferenca, 
mais os resfduos estarao afastados da norma- 
lidade. O diagrama das probabilidades normais 
mostra tambem os desvios da normalidade 
(veja o Capftulo 2). A linha reta neste diagrama 


Saida: Vendas de disco (em milhares) 



Verba publicitaria (em milhares de libras) 


representa a distribuicao normal e os pontos, os 
resfduos observados. Portanto, em um conjunto 
de dados perfeitamente normal; todos os pon¬ 
tos estarao bem proximos da linha. Isso e o que 
enxergamos para os dados da venda de discos. 
Contudo, proximo ao diagrama dos dados nor- 
malmente distribufdos da venda de discos esta 
um exemplo de um afastamento extremo da 
normalidade. Neste diagrama, os pontos estao 
bem distantes da linha, o que indica um grande 
afastamento da normalidade. Para os dois dia- 
gramas, os dados nao-normais sao casos extre- 
mos e voce deve ficar atento para desvios da 
normalidade mais sutis. E claro que voce pode 
utilizar o que aprendeu no Capftulo 2 para rea- 
lizar um teste K-S nos resfduos padronizados a 
fim de ver se eles se desviam ou nao de forma 
significativa da normalidade. 


Saida: Vendas de disco (em milhares) 



Saida: Vendas de disco (em milhares) 



Atratividade da banda 
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Um conjunto final de diagramas, os diagra- 
mas parciais, foi especificado na Figura 5.14. 
Esses diagramas sao dispersoes dos resfduos da 
variavel de safda e de cada um dos previsores 
quando as duas variaveis sao modeladas sepa- 
radamente dos demais previsores. Mencionei 
antes que valores atfpicos obvios em um gra- 
fico parcial representam casos que podem ter 
influencia nos coeficientes dos previsores da 
regressao e que relacionamentos nao-lineares 
e heterocedasticos podem ser detectados, da 
mesma forma, utilizando esses diagramas. 

Para os dados da verba publicitaria, os 
diagramas parciais mostram um relaciona- 
mento positivo forte com as vendas de disco. 
O gradiente da linha e b para a verba publici¬ 
taria no modelo (essa linha nao e mostrada por 
omissao). Nao existem valores atfpicos obvios 
nesse diagrama e a nuvem de pontos e igual- 
mente espacada em torno da linha, indicando 
homocedasticidade. 

Para o numero de executes {airplay), 
os diagramas parciais mostram um relaciona- 
mento positivo forte com a venda de discos. O 
gradiente e o padrao dos dados sao semelhan- 
tes aos da verba publicitaria (o que ja era es- 
perado devido a semelhanga dos beta padroni- 


zados desses previsores). Nao existem valores 
atfpicos obvios nesse diagrama e a nuvem de 
pontos esta igualmente espacada em torno da 
linha indicando homocedasticidade. 

Para a atratividade ( atractiveness ), os dia¬ 
gramas parciais mostram um relacionamento 
positivo forte com as vendas de discos. O re¬ 
lacionamento parece menos linear do que os 
demais previsores e os pontos parecem afuni- 
lados indicando um aumento da variancia em 
nfveis mais altos da atratividade. Nao se perce- 
bem valores atfpicos obvios nesses dados, mas 
a nuvem de pontos em forma de fund pode in¬ 
dicar uma violagao da hipotese de homocedas¬ 
ticidade. Seria adequado coletar alguns dados 
adicionais sobre bandas com baixa atratividade 
como forma de verificar o modelo atual. 

Podemos resumir dizendo que o modelo 
parece, as vezes, em muitos sentidos, ser tanto 
preciso para a amostra e generalizavel para a 
populacao. O unico senao e se a atratividade 
da banda violou a hipotese de homocedasti¬ 
cidade. Portanto, podemos concluir que em 
nossa amostra a verba publicitaria e o nume¬ 
ro de execugSes sao igualmente importantes 
em prever a venda de discos. A atratividade 
da banda e um previsor significativo da ven- 


/ - | - 

Dica da Samanta Ferrinho 





V 


Voce precisa certificar-se de que algumas hipoteses da regressao foram satisfei- 
tas a fim de ficar seguro de que ele pode ser generalizado para alem da amostra. 

• Verifique o grafico do *ZRESID contra o *ZPRED. Se ele parecer com um con- 
junto aleatorio de pontos, isso e bom. Se o grafico parecer abrir como um funil 
de um lado ou outro, provavelmente teremos uma violagao da hipotese de 
homogeneidade da variancia. Se os pontos tiverem um padrao (forma curva), 
provavelmente teremos uma violagao da linearidade. Se os dados parecem ter 
um padrao e estao mais espalhados em um ponto do que em outros, e prova- 
vel que isso reflita uma violagao tanto da homogeneidade da variancia quanto 
da linearidade. Qualquer um desses cenarios colocara a validade do nosso 
modelo em cheque. Repita a analise para os diagramas parciais tambem. 

• Examine os histogramas e os diagramas P-R Se os histogramas parecem com 
uma distribuigao normal (e o diagrama P-P se assemelha a uma linha diago¬ 
nal), tudo esta bem. Se o histograma parece nao-normal e o diagrama P-P se 
assemelha a uma cobra enrolada em torno da linha diagonal, as coisas nao 
estao tao boas! Fique atento: distribuigoes normais podem parecer nao-nor- 
mais quando trabalhamos com pequenas amostras! 
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da de discos, mas e menos importante que os 
demais previsores (e provavelmente precisa 
de uma confirmagao de uma possivel hetero- 
cedasticidade). As hipoteses parecem ter sido 
satisfeitas e podemos provavelmente assumir 
que o modelo podera ser generalizado para os 
novos discos sendo langados. 

5.9 COMO RELATAR A REGRESSAO 
MULTIPLA © 

Se voce seguir as recomendacoes da APA 
(American Psychological Association) para 
relatar a regressao multipla, os resultados tabe- 
lados devem ser como os apresentados adiante. 
A APA tambem exige que sejam apresentados 
os betas padronizados, seus valores da signi¬ 
ficancia e algumas estatfsticas gerais sobre o 
modelo (tal como o R 2 ). Se voce decidir fazer 
uma tabela, os valores beta e seus erros padrao 
tambem serao bastante Lite is assim como a 
constante, para que os leitores do seu trabalho 
possam reproduzir o modelo completo se ne- 
cessario. Ainda, se voce executou uma regres¬ 
sao hierarquica, deve relatar esses valores em 
cada estagio da hierarquia. Desse modo, basi- 
camente, voce vai reproduzir a tabela denomi- 
nada de coeficientes ( coefficients ) da saida do 
SPSS omitindo as informacoes nao-essenciais. 
Para o exemplo deste capitulo podemos produ- 
zir uma tabela como a 5.2. 

Assim, voce podera retomar a algumas das 
saidas do SPSS neste capitulo e descobrir de 


Tabela 5.2 Como relatar a regressao multipla 



B 

SEB 

P 

Passo 1 

Constante 

134,14 

7,54 


Verba publicitaria 

0,10 

0,01 

0,58* 

Passo 2 

Constante 

-26,61 

17,35 


Verba pu blicitaria 

0,09 

0,01 

0,51* 

Execugoes na Ra- 

3,37 

0,28 

0,51* 

dio 1 da BBC 

Atratividade 

11,09 

2,44 

0,19* 


Nota: R 2 = 0,34 para o Passo 1; A R 2 = 0,33 para o passo 2 
(ps < 0,001). *p < 0,001. 


onde esses valores vieram. As coisas a serem 
destacadas sao: (1) arredondamos todos os va¬ 
lores para a segunda casa decimal; (2) para os 
betas padronizados nao existe o zero antes da 
virgula (porque esses valores nao podem ex- 
ceder 1),* mas para todos os demais valores 
menores do que um o zero esta presente; (3) 
a significancia de uma variavel e representada 
por um asterisco com uma nota de rodape a 
fim de indicar o nivel de significancia sendo 
utilizado (se existir mais do que um nivel de 
significancia, voce pode representar isso com 
multiplos asteriscos, tal como, *p < 0,05, **p 
< 0,01 e ***p < 0,001) e (4) o R 2 para o mode¬ 
lo inicial e a mudanga no R 2 (representada por 
A R 2 ) para cada passo subsequente do modelo 
sao apresentados embaixo da tabela. 

5.10 PREVISORES CATEGORIES E A 
REGRESSAO MULTIPLA © 

Muitas vezes na analise de regressao, co- 
letamos dados sobre grupos de pessoas (alguns 
exemplos das ciencias sociais podem ser o gru- 
po etnico, o genero, o status socioeconomico e 
a categoria de diagnostico). Voce pode querer 
esses grupos como previsores no modelo de re¬ 
gressao; contudo, vimos que entre as hipoteses 
do modelo esta a necessidade de as variaveis se¬ 
rem continuas ou pelo menos categoricas com 
apenas duas categorias. Vimos na Segao 4.5.6 
que a correlagao ponto-bisserial e o r de Pearson 
entre duas variaveis quando uma e continua e a 
outra tern duas categorias codificadas como 0 e 
1. Tambem aprendemos que a regressao simples 
e baseada no r de Pearson, assim, nao sera ne- 
cessario muita imaginagao para ver que, como 
a correla^ao ponto-bisserial, podemos construir 
um modelo de regressao com um previsor que 
tem duas categoriais (por exemplo, genero). Da 
mesma forma, nao deve ser tao inconcebivel 
perceber que podemos estender esse modelo 
para incorporar varios previsores que tem duas 


* N. de T.: Essa observagao nao cabe aqui, pois os va¬ 

lores no Brasil sempre sao escritos com o zero antes 

da virgula, diferentemente do sistema anglo-saxao que 
costuma representar numeros entre —lei sem o zero 
antes do ponto decimal (virgula para nos). 
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categorias. O que importa e que as categorias se- 
jam codificadas com os valores 0 e 1. Por que e 
importante que so existam duas categorias e que 
elas sejam codificadas como 0 e 1 ? Nao quero 
entrar nesse assunto porque este capftulo ja esta 
muito longo e os editores irao me xingar se ele 
aumentar mais, e eu irei aborda-lo, de alguma 
forma, mais tarde no livro (Se 9 oes 7.8 e 8.2.2). 
Assim, por enquanto, apenas acredite em mim! 

5.10.1 Variaveis dummy ® 

O problema obvio com a utilizacao de va¬ 
riaveis categoricas como previsores e que mui- 
tas vezes temos mais do que duas categorias. 
Por exemplo, se a religiosidade for mensurada 
voce podera ter categorias como: mugulmanos, 
judeus, hindus, catolicos, budistas, protestan- 
tes, Jedi (para os nao-britanicos: foi feito um 
censo no pais a alguns anos e uma quantidade 
significativa de pessoas declararam Jedi como 
sua religiao). Claramente esses grupos nao 
podem ser distinguidos utilizando uma unica 
variavel codificada como zero e um. Nesses 
casos, teremos que utilizar o que foi chamado 
de variavel dummy (fictfcia). A codificacao 
dummy e uma forma de representar grupos de 
pessoas com somente zeros e uns. Para tanto, 
precisamos criar diversas variaveis; de fato, o 
numero de variaveis necessarias e uma a me- 
nos do que o numero de categorias que esta- 
mos codificando. Existem oito passos basicos: 

1. Conte o numero de grupos que voce quer 
codificar e subtraia 1. 

2. Crie tantas variaveis quanto o valor que 
foi determinado no passo 1. Essas sao as 
variaveis dummy. 

3. Escolha um dos seus grupos como base 
(isto e, o grupo contra o qual todos os de- 
mais serao comparados). Ele deve ser uti- 
lizado como grupo-controle, ou, se voce 
nao tern uma hipotese especifica, ele deve 
ser o grupo que representa a maioria das 
pessoas (porque sera importante compa- 
rar outros grupos contra a maioria). 

4. Tendo escolhido o grupo-base, atribua a 
esse grupo o valor 0 para todas as varia¬ 
veis dummy. 


5. Para a primeira variavel dummy, atribua o 
valor 1 ao primeiro grupo que voce quer 
comparar contra o grupo-base. Atribua 
em todos os demais grupos o valor 0 para 
essa variavel. 

6. Para a segunda variavel dummy atribua o 
valor 1 ao segundo grupo que voce quer 
comparar ao grupo-base. Atribua a todos os 
demais grupos o valor 0 para essa variavel. 

7. Repita isso ate que voce nao tenha mais 
variaveis dummy. 

8. Coloque todas as variaveis dummy na ana- 
lise de regressao! 

Vamos testar isso utilizando um exemplo. 
No Capftulo 3, vimos um exemplo no qual uma 
biologa estava preocupada sobre os efeitos po- 
tenciais dos festivals de nuisica na saude. Ela 
foi ao festival de musica de Glastonbury e men- 
surou a higiene dos frequentadores do concer¬ 
to durante os tres dias de realizacao do mesmo, 
utilizando uma tecnica que resulta em escores 
variando de 0 (a pessoa cheira como se tivesse 
tornado banho no esgoto) e 5 (a pessoa cheira 
como pao recem-safdo do forno). No Capftulo 
3, nos preocupamos apenas com a distribui^ao 
dos escores dos tres dias do festival; mas ima¬ 
gine se a biologa quisesse verificar o decresci- 
mo da higiene ao longo do tres dias do festival. 
O arquivo de dados GlastonburyFestival- 
Regression.sav pode ser encontrado no site 
www.artmed.com.br. Ele content os escores da 
higiene para cada um dos tres dias do festival 
e uma variavel denominada mudan^a (Chan¬ 
ge), que e a mudanca na higiene durante os tres 
dias do festival (a alteracao ocorrida do dia 1 
ao dia 3). 16 A biologa categorizou as pessoas 
de acordo com a sua afiliagao musical: as que 
preferiam musica alternativa foram chamadas 
de “pagodeiros”, as que gostavam mais de he¬ 
avy metal foram denominadas “metaleiros”, e 
as que gostavam de algum tipo de hippie/folk/ 
ambiente receberam o nome de punks. Qual- 
quer uma que nao se encaixasse nessas catego- 


16 Lembre-se do Capftulo 3 que nera todo mundo pode 
ser mensurado no terceiro dia, assim, os escores de mu- 
danqa sao para um subconjunto da amostra original. 
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riais foi rotulada de “ecleticos”. No arquivo de 
dados, ela codificou esses grupos como 1, 2, 3 
e 4, respectivamente. 

A primeira coisa que voce deve fazer e cal- 
cular o numero de variaveis dummy. Se temos 
quatro grupos, deverao existir tres variaveis 
dummy (uma a menos que o numero de gru¬ 
pos ou categorias). Depois precisamos defmir 
o grupo-base. Queremos comparar as pessoas 
que tem afiliagao musical com as que nao tern, 
assim, a nossa categoria base sera “ecleticos”. 
Daremos a esse grupo o codigo 0 para todas as 
nossas variaveis dummy. Para a primeira va¬ 
riavel dummy, podemos olhar para grupo punk 
e para fazer isso daremos a todos os punks o 
codigo 1, e aos demais o codigo 0. Para a nos¬ 
sa segunda variavel dummy, usaremos o grupo 
dos “metaleiros”, e daremos a qualquer pessoa 
que pertenga a esse grupo o codigo 1, e aos 
outros o 0. Temos ainda uma variavel dummy 
sobrando, destinada ao grupo “pagodeiros”: 
vamos dar a cada pagodeiros o codigo 1 e aos 
demais, o codigo 0. O esquema final e mostra- 
do na Tabela 5.3. Voce deve observar que em 
cada grupo o codigo 1 foi utilizado em apenas 
uma variavel dummy (exceto na categoria base 
que e sempre codificada como 0). 

Como ja disse, iremos prestar atengao 
em como essa codificagao funciona na Segao 
7.8 e 8.2.2; por enquanto, verifique como co- 
dificar nossa variavel de agrupamento nessas 
variaveis dummy utilizando o SPSS. Para co- 
dificar variaveis, voce precisa utilizar a fungao 
Recode (recodificar), Use Transforms Re¬ 
codes Into Different Variables... (Trans- 
formar=>Recodificar=>Em diferentes varia¬ 
veis) para acessar a caixa de dialogo vista na 
Figura 5.20. A primeira caixa de dialogo lista 


Tabela 5.3 Codificagao dummy para os 
dados do festival de Glastonbury 



Variavel 
dummy 1 

Variavel 
dummy 2 

Variavel 
dummy 3 

Ecleticos 

0 

0 

0 

Pagodeiros 

0 

0 

1 

Metaleiros 

0 

1 

0 

Punks 

1 

0 

0 


todas as variaveis no editor de dados, e voce 
precisa selecionar as que quiser recodificar 
(nesse caso, music - musica) e transferi-las 
para o painel denominado Numeric Variable 
—> Output Variable (Variavel numerica —» Va¬ 
riavel de Saida) clicando em _J. Voce precisa 
entao dar um nome para a nova variavel (a va¬ 
riavel de safda, de acordo com a denominagao 
do SPSS). Para tanto, va para a parte deno- 
minada Output Variable (Variavel de Safda) 
e no espago onde diz Name (Nome), escreva 
o nome para a sua primeira variavel dummy 
(voce podera chama-la de musicl). Voce deve 
dar a essa variavel um nome mais descritivo 
digitando algo no espago denominado Label 
(Rotulo) (denominamos essa primeira varia¬ 
vel dummy de ecleticos x punks). Quando 
voce tiver feito isso, clique em < yl a fim de 
transferir essa nova variavel para o painel de¬ 
nominado Numeric Variable —» Output Varia¬ 
ble (Variavel numerica —> Variavel de Safda); 
esse painel deve apresentar agora a seguinte 
legenda music — » musicl. 

Uma vez definida a primeira variavel 
dummy, precisamos informal - ao SPSS como 
recodificar os valores da variavel music nos 
novos valores que queremos para a nova varia¬ 
vel musicl. Para tanto, clique em °"— a 
fim de abrir a segunda caixa de dialogo como 
a da Figura 5.20. Essa caixa de dialogo e utili- 
zada a fim de mudar os valores da variavel ori¬ 
ginal para valores diferentes da nova variavel. 
Para a primeira variavel dummy, queremos 
que qualquer um que seja punk tenha um co- 
digo de 1 e os demais, um codigo de 0. Punks 
foram codificados com o valor 3 na variavel 
original, assim, e preciso digitar 3 na segao de- 
nominada Old Value (Valor Antigo) no espago 
chamado de Value (Valor). O novo valor que 
queremos e 1, dessa forma, sera necessario di¬ 
gitar o valor 1 na segao denominada New Va¬ 
lue (Valor novo) no espago chamado de Value 
(Valor). Depois, clique em «*■ para adicio- 
nar isso a lista de alteragoes (a lista e mostrada 
no painel denominado Old —> New (Velho —> 
Novo), em que deve agora deve estar escrito 3 
—> 1, como no diagrama). O proximo passo e 
alterar os grupos remanescentes que apresen- 
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Figura 5.20 Caixa de dialogo para a fungao Recode (recodificar). 


tam o valor 0 para a primeira variavel dummy. 
Para tanto, selecione other values e digite o 
valor 0 na segao denominada New Value (Valor 
Novo) no espaco Value (Valor). Quando tiver 
feito isso, clique em a fim de adicionar 
essa alteragao a lista de mudangas (essa lista 
esta mostrando ELSE —> 0). Depois, clique em 
c °"‘— para retornar a caixa de dialogo principal 
e clique em a fim de criar a primeira va¬ 
riavel dummy. Essa variavel ira aparecer agora 
em uma nova coluna no editor de dados e voce 
ira notar que ela tem um valor de 1 para qual- 
quer pessoa originalmente classificada como 
punk e o valor 0 para os demais. Agora, tente 
criar as proximas duas variaveis dummy (de- 
nomine-as de Music2 e Music3) utilizando os 
mesmos princfpios. 


5.10.2 Saida do SPSS para variaveis 
auxiliares (dummy) ® 

Vamos assumir que criamos as variaveis 
de codigo ou auxiliares (se voce ainda nao 
conseguiu, use o arquivo de dados denomi- 
nado GlastonburyDummy.sav). Voce pre- 
cisa entrar com todas as variaveis auxiliares 
relacionadas no mesmo bloco (assim, utilize 
o metodo Enter). Neste caso, teremos que en¬ 
trar com as variaveis dummy no mesmo blo¬ 
co; contudo, se tivessemos outra variavel (por 
exemplo, status socioeconomico) que tivesse 
sido transformada em uma variavel dummy, 
poderfamos inseri-la em um bloco diferente 
(assim, apenas as variaveis dummy recodifi- 
cadas de uma mesma variavel precisam ser 
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Quadro 5.3 


Utilizando a sintaxe para recodificar (D 

Se voce esta fazendo muitas recodificagoes, logo ira cansar de utilizar a caixa de dialogo to- 
das as vezes. No site www.artmed.com.br, ha um arquivo de sintaxe, RecodeGlastonburyData. 
sps, que eu escrevi para criar todas as variaveis dummy que foram discutidas. Carregue esse 
arquivo e rode a sintaxe, ou abra a janela da sintaxe (veja a Segao 2.6) e digite o seguinte: 

RECODE music (3 = 1) (ELSE = 0) INTO Musicl. 

RECODE music (2 = 1) (ELSE = 0) INTO Music2. 

RECODE music (1 = 1) (ELSE = 0) INTO Music3. 

VARIABLE LABELS Musicl 'No affiliation vs. Crusty'. Ecleticos vs. Punks 

VARIABLE LABELS Music2 'No affiliation vs. Metaller'. Ecleticos vs. Metaleiros 

VARIABLE LABELS Music3 'No affiliation vs. Indies Kid'. Ecleticos vs. Pagodeiros 

EXECUTE. 

Cada comando RECODE realiza o equivalente ao que eu fiz quando utilizei a caixa de dialogo 
apresentada na Figura 5.20. Assim, as primeiras tres linhas apenas criam tres novas variaveis 
(Musicl, Music2 e Music3), baseadas na variavel original Music. Para essa primeira variavel, se 
music e igual a 3, entao ela torna-se 1, e todos os demais valores tornam-se 0. Para a segunda, 
se music e igual a 2, ela torna-se 1 e os demais valores ficam iguais a 0. A mesma logica vale 
para a terceira variavel dummy. As linhas iniciando com VARABLES LABELS dizem ao SPSS para 
atribuir o texto entre apostrofes como rotulos para as variaveis Musicl, Music2 e Music3, respec- 
tivamente. A linha final tern o comando EXECUTE, sem o qual nenhum dos comandos anteriores 
sera executado. Observe ainda que cada linha termina com um ponto final. 


colocadas em blocos). Use o que voce apren- 
deu neste capftulo para rodar uma regressao 
multipla utilizando os escores alterados como 
safda e as tres variaveis auxiliares (colocadas 
em blocos) como previsores. Vamos dar uma 
olhada na safda. 

A Safda 5.12 do SPSS mostra as estatfsti- 
cas do modelo. Isso mostra que entrando com 
as tres variaveis dummy, podemos explicar 
7,6% da variancia dos escores da higiene (o 
valor R 2 ). Em outras palavras, 7,6% da varian¬ 
cia nos escores da higiene pode ser explicada 
pela afi I i agao musical da pessoa. A ANOVA 
(que mostra o mesmo que a estatfstica de 
mudanca R 2 porque existe apenas um passo 
nessa regressao) nos informa que o modelo e 
significantemente melhor em prever a mudan¬ 
ca nos escores da higiene do que nao ter um 
modelo (ou seja, 7,6% da variancia explicada 
e uma quantia significativa). Isso deve ficar 


claro com base no que voce leu neste capftulo; 
o que e mais interessante e como interpretar as 
variaveis dummy individualmente. 

A Safda 5.13 do SPSS mostra a tabela ba- 
sica dos coeficientes para as variaveis dummy 
(excluf os intervalos de confianca e o diagnos- 
tico de colinearidade). A primeira coisa a ob- 
servar e que cada variavel dummy aparece na 
tabela com um rotulo util (tal como punks ver¬ 
sus ecleticos). Isso acontece porque quando 
codificamos as nossas variaveis, fornecemos 
um rotulo a cada uma; se nao tivessemos feito 
isso, a tabela conteria os nomes bem menos 
uteis das variaveis (musicl, music2 e music3). 
Os rotulos que eu sugeri que fossem forneci- 
dos para as variaveis nos dao uma boa dica so- 
bre o que cada variavel representa. A primeira 
variavel dummy (ecleticos versus punks) mos¬ 
tra a difercnga entre a mudan 9 a nos escores 
da higiene para os grupos ecleticos e punks. 
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Saida 5.12 do SPSS 

Model Summary b (Resumo do Modelo) 






Std. Error 
of the 
Estimate 
(Erro 

Padrao da 
Estimativa) 

Change Statistics (Estatisticas de Mudanga) 


Model 

(Modelo) 

R 

R Square 
(R 

quadrado) 

Adjusted 

R Square 
(R 

Quadrado 

Ajustado) 

R Square 
Change 
(Mudanga 
do R 

quadrado) 

FChange 
(Mudanga 
no F) 

dfl 

(gii) 

df2 

(gi2) 

Sig.F 
Change 
(Sig. da 
Mudanga 
no F) 

Durbin- 

Watson 

i 

0.276 s 

0.076 

0.053 

0.68818 

0.076 

3.270 

3 

119 

0.024 

1.893 


a. Previsores (Constante) Ecleticos vs. Pagodeiros, Ecleticos vs. Punks, Ecleticos vs. Metaleiros. 

b. Variavel Dependente: Mudanga na higiene ao longo do festival 


AI\IOVA b (Analise de Variancia) 


Model (Modelo) 

Sum of Squares 
(Soma dos quadrados) 

df 

(gi) 

Mean Square 
(Media dos Quadrados) 

F 

Sig. 

1 Regression (Regressao) 

4.646 

3 

1.549 

3.270 

0.024 s 

Residual (Reslduos) 

56.358 

119 

0.474 



Total 

61.004 

122 





a. Previsores (Constante) Sem Afiliagao vs. pagodeiros, Sem afiliagao vs. punks, Sem Afiliagao vs. Metaleiros. 

b. Variavel Dependente: Mudanga na higiene ao longo do festival 


Lembre-se de que os valores beta nos infor¬ 
mant a mudanga na safda devido a uma uni- 
dade no previsor. Nesse caso, a mudanga de 
uma unidade no previsor e uma alteragao de 0 
para 1. Ela mostra a mudanga nos escores da 
higiene como resultado mudanga da variavel 
dummy de 0 para 1 (punk). Pela inclusao das 
tres variaveis ao mesmo tempo, nossa catego- 
ria base e sempre 0; assim, isso representa a 
mudanga nos escores da higiene se uma pes- 
soa ecletica e comparada com um punk. Essa 
mudanga e a diferenga entre as medias dos 
dois grupos. Para ilustrar isso, produzi uma 
tabela com as medias de cada um dos quatro 
grupos. Essas medias representam a mudanga 
media nos escores da higiene para os tres gru¬ 
pos (isto e, os homens de cada grupo na nossa 
variavel de safda). Se calcularmos as diferen- 
gas entre essas medias para o grupo dos ecle¬ 
ticos e o dos punks, obteremos: Punks - Ecle¬ 
ticos = (-0,9658) - (-0,5543) = -0,4120. 
Ou seja, a mudanga nos escores da higiene e 
maior para o grupo dos punks do que para os 
ecleticos (a higiene dos punks decresce mais 
ao longo dos tres dias do festival do que a dos 


ecleticos). Esse valor e o mesmo que o beta na 
Safda 5.13 do SPSS! Assim, os valores beta 
nos informam a diferenga relativa entre cada 
grupo e o grupo que foi escolhido como ca- 
tegoria base. Esse valor beta e convertido em 
uma estatistica tea significance dessa esta- 
tfstica e calculada. Essa estatistica esta testan- 
do, como ja foi visto antes, se o valor e 0, e 
quando nos temos duas categorias codificadas 
com 0 e 1, isso significa que o que esta sendo 
testado e se a diferenga entre grupos e zero. 
Se ela e significativa, isso quer dizer que o 


Report (Relatorio) 


Change in Hygiene Over The Festival 
(Mudanga da Higiene ao Longo do Festival) 


Musical Affiliation 
(Afiliagao Musical) 

Mean 

(Medias) 

N 

Std 

Deviation 

(Desvios 

Padrao) 

Indie Kid (Pagodeiros) 

- 0.9643 

14 

0.67020 

Metaller (Metaleiros) 

-0.5259 

27 

0.57583 

Crusty (Punks) 

- 0.9658 

24 

0.76038 

No Musical affiiia- 

-0.5543 

58 

0.70834 

tion (Ecleticos) 

Total 

-0.6750 

123 

0.70713 
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Saida 5.13 do SPSS 



Coefficients a (Coeficientes) 




Unstan dardized 
Coefficients 
(Coeficientes 
nao-padronizados) 

Standardized 

Coefficients 

(Coeficientes 

padronizados) 



Model (Modelo) 

B 

Std. Error 
(Erro Padrao) 

Beta 

t 

Sig. 

1 (Constant) (Constante) 

-0.554 

0.090 


-6.134 

0.000 

No affiliation i /s. Crusty (Ecleti¬ 
cos vs. Punks) 

-0.412 

0.167 

-0.232 

- 2.464 

0.015 

No affiliation vs. Meta Her (Ecleti¬ 
cos vs. Meta lei ros) 

0.028 

0.160 

0.017 

0.177 

0.860 

No affiliation vs. Indie Kid (Ecle¬ 
ticos i/s. Pagodeiros) 

-0.410 

0.205 

-0.185 

-2.001 

0.048 


a. Variavel dependente: mudanga na higiene ao longo do festival. 


grupo codificado como 1 e significativamente 
diferente da categoria base - assim, ela esta 
testando a diferenga entre duas medias, que 
e o contexto onde voce estara mais familiari- 
zado com a estatfstica t (veja o Capftulo 7). 
Para a nossa primeira variavel dummy, o teste 
t e significativo, e o valor beta e negativo; as¬ 
sim, podemos dizer que a mudanca na higiene 
decresce quando uma pessoa passa do grupo 
dos ecleticos para o grupo dos punks. Tenha 
em mente que um decrescimo nos escores da 
higiene representa uma mudanca maior (voce 
esta ficando mais fedorento), ou seja, a higie¬ 
ne decresce significativamente mais nos punks 
do que nos ecleticos. 

A proxima variavel dummy compara me- 
taleiros a ecleticos. O valor beta novamente 
representa a mudanca na higiene se uma pes¬ 
soa ecletica e comparada com um metaleiro. 
Se calcularmos a diferenca entre as medias dos 
grupos para o grupo ecletico e o dos metalei- 
ros, obteremos: metaleiro - ecletico = (-0,5259 
— (—0,5543) = 0,028. Esse valor e novamen¬ 
te igual ao valor beta na Saida 5.13 do SPSS! 
Para essa segunda variavel dummy, o teste t 
nao e significativo, assim, podemos dizer que 
a mudanca dos escores da higiene e o mesmo 
se uma pessoa muda do grupo ecletico para o 
metaleiro. Em outras palavras, a mudanca nos 
escores da higiene nao e previsfvel se uma pes¬ 
soa e metaleira comparada com uma ecletica. 


Em nossa ultima variavel dummy, com- 
paramos punks com ecleticos. O valor beta 
novamente representa a alteracao nos escores 
da higiene se uma pessoa sem afiliacao musi¬ 
cal e comparada com um pagodeiro. Se cal¬ 
cularmos a diferenca nas medias dos grupos 
entre os sem afilia£ao e os pagodeiro, obtere¬ 
mos: pagodeiro - sem afiliagao = (—0,9643) 
— (—0,5543) = —0,410. Nao deve ser mais 
surpresa agora que esse valor e o beta da Saida 
5.13 do SPSS! O teste t e significativo e o beta 
tern um valor negativo, assim, como ocorreu 
com a primeira variavel dummy, podemos 
dizer que a mudanca nos escores da higiene 
diminui se uma pessoa muda de sem afiliacao 
para pagodeiro. Lembre-se de que um decres¬ 
cimo nos escores da higiene representa mais 
alteragoes (voce esta se tornando mais fedi- 
do); ou seja, pagodeiros sao significativamen¬ 
te mais fedorentos do que os ecleticos! 

De forma geral, essa ana- 
lise mostrou que, comparado 
com o grupo ecleticos, os gru¬ 
pos de punks e pagodeiros fi- 
cam mais fedidos ao longo 
dos tres dias do festival, mas o grupo de me- 
taleiros nao. Esta secao introduziu algumas 
ideias complexas que irei detalhar nos Capf- 
tulos 7 e 8. Se voce estiver muito confuso ou 
quiser saber mais sobre como variaveis 
dummy funcionam, sugiro que voce leia as 
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Segoes 7.8 e 8.2.2 e depois volte para ca. Ou- 
tra dica e ler a excelente monografia de Har¬ 
dy (1993)! 

5.11 OQUEDESCOBRIMOSSOBRE 
ESTATISTICA? ® 

Este e o capftulo mais longo do livro, e 
se voce sente que envelheceu alguns anos en- 
quanto o lia, isso provavelmente aconteceu 
(olhe ao redor: existem teias de aranha na sala, 
sua barba cresceu e se voce olhar pela janela 
ira ver que uma segunda era glacial aconteceu 
e no planeta restam somente a sua pessoa e 
alguns mamutes). Contudo, analisando pelo 
lado bom, agora voce sabe um bocado sobre 
regressao, que e a base de praticamente toda 
a estatistica! Os proximos conteudos deste li¬ 
vro sao apenas variagoes sobre o tema deste 
capftulo. 

Comegamos este capftulo analisando a si- 
tuagao quando se tem um previsor e uma safda. 
Isso nos permitiu verificar alguns princfpios 
basicos, como a equagao da linha, o metodo 
dos mfnimos quadrados e o modo de avaliar se 
o nosso modelo adere aos dados utilizando al- 
gumas quantidades importantes que voce vera 
novamente nos proximos capftulos: a soma 
dos quadrados do modelo, SS M , a soma dos 
quadrados dos resfduos, SS R . e a soma total dos 
quadrados, SS T . Utilizamos esses valores para 
calcular varias estatfsticas importantes, tais 
como oK ! ea razao F. Tambem aprendemos a 
executar uma regressao no SPSS e a colocar o 
valor beta resultante na equagao da linha para 
fazer uma previsao sobre nossa safda. 

Depois, descobrimos que ffilfl iiliSBSfflffllt 
linha pode ser generalizada para incluir va- 
rios previsores e verificamos diversos meto- 

dos de entrar com as variaveis previsoras no 

a passo). Vimos os fatores que podem afetar 
a precisao de um modelo (valores atfpicos e 
casos influentes) e formas de identificar esses 
fatores. Em seguida, analisamos as suposigoes 
necessarias a fim de generalizar nosso modelo 
para alem da amostra de dados que coletamos 
antes de descobrir como fazer a analise no 


SPSS e como interpretar a safda, criar nosso 
modelo de regressao multipla e testar sua con- 
fiabilidade e generalidade. Terminei o capftu¬ 
lo ensinando como podemos utilizar previso¬ 
res categoricos na regressao (e de passagem 
descobrimos sobre a fungao de recodificagao 
[recode]). Em geral, a regressao multipla e 
um longo processo que deve ser feito com 
cuidado e com atengao aos detalhes. Existem 
muitos pontos importantes a considerar e voce 
deve utilizar uma abordagem sistematica. Es- 
pero que este capftulo o ajude a fazer isso. Um 
aspecto que nao consideramos foi se podemos 
utilizar variaveis categoricas como safda (em 
vez de previsores) e o proximo capftulo fala- 
ra sobre um tipo especffico de regressao que 
pode fazer exatamente isso! Antes, porem, 
preciso tomar uma dose de Valium. 

5.12 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• Aderencia 

• Autocorrelagao 

• b, 

• A 

• Colinearidade perfeita 

• DFBeta 

• DFBeta padronizado 

• DFFit 

• DFFit padronizado 

• Distancia de Cook 

• Distancia de Mahalanobis 

• Efeitos supressores 

• Encolhimento 

• Erros independentes 

• Estatistica t 

• Fator de inflagao da variancia (FIV) 

• Generalizagao 

• Heterocedasticidade 

• Homocedasticidade 

• Influencia 

• Multicolinearidade 

• Quadrados medios 

• Rmultiplo 

• K 2 Ajustado 

• Razao de Covariancia (CVR) 

• Razao F 
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• Regressao multipla 

• Regressao passo a passo 

• Regressao simples 

• Resfduo 

• Resfduo exclufdo 

• Resfduos estudentizados 

• Resfduos exclufdos estudentizados 

• Resfduos nao-padronizados 

• Resfduos padronizados 

• Soma dos quadrados do modelo 

• Soma dos quadrados dos resfduos 

• Soma total dos quadrados 

• Teste de Durbin-Watson 

• Tolerancia 

• Validacao cruzada 

• Valor previsto ajustado 

• Valores Chapeu 

• Variavel de safda 

• Variavel dummy 

• Variavel previsora 

5.13 TAREFAS DO ALEX ESPERTO 

As respostas para essas tarefas podem ser 
encontradas no site www.artmed.com.br no 
arquivo (Chapter 5).pdf. 

• Uma estudante de moda esta interessada 
em fatores que possam prever os salarios 
de modelos de passarela. Ela coletou da¬ 
dos de 231 modelos. Para cada modelo, ela 
perguntou o salario diario nos dias em que 
elas estavam trabalhando (salary), a idade 
(age), quanto tempo elas estao trabalhan¬ 
do como modelos (years). A estudante 
tambem reuniu um painel de especialistas 
de agendas de modelo a fim de dar uma 
nota para a atratividade de cada modelo, 
com uma percentagem de 100% represen- 
tando o maximo de atratividade (beauty). 
Os dados estao no site www.artmed.com. 


br no arquivo Supermodel.sav. Infeliz- 
mente, essa estudante de moda comprou 
alguns textos de estatfstica nao muito bons 
e nao sabe como analisar os seus dados. 
© Voce pode ajuda-la conduzindo uma 
regressao multipla para verificar quais fa- 
tores preveem o salario da modelo? Quao 
valido e o modelo de regressao? @ 

• Utilizando os dados de Glastonbury des- 
te capftulo (com os codigos dummy em 
GlastonburyDummy.sav), que voce ja 
analisou, comente se voce julga que o 
modelo e confiavel e generalizavel. © 

5.14 LEITURAS COMPLEMENTARES 

BOWERMAN, B. L, O’CONNELL, R. T. Linear 
statistical models: an applied approach. 
Belmont (CA): Duxbury, 1990. 2 a ed. Esse 
texto e destinado somente para os que gostam 
de matematica ou estudantes de pos-graduagao, 
mas fornece uma exposigao extremamente 
abrangente da analise de regressao. 

HARDY, M. A. Regression with dummy variables. 
Sage university paper series on quantitative 
applications in the Social Sciences. 07-093. 
Newbury Park (CA): Sage, 1993. 

HOWEL, D. C. Statistical methods for 

psychology. Belmont (CA): Duxbury, 2002. 
5 a ed. Os Capftulos 9 e 15 sao excelentes 
introduces a matematica por tras dos modelos 
de regressao. 

MILES, J., SHEVILIN, M. Applying regression 
and correlation: a guide for students and 
researchers. London: Sage, 2001. Esse texto 
bastante simples aborda a regressao em 
detalhes com um mfnimo de esforgo. Altamente 
recomendavel. 

STEVENS, J. Applied multivariate statistics for 
the social sciences. Hillsdale (NJ): Erlbaum, 
1992. 2 a ed. Capftulo 3. 



6 

REGRESSAO LOGISTICA 


6.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 

No capftulo anterior, vimos como modelar 
o relacionamento entre uma ou mais variaveis 
previsoras e uma safda. Este capftulo amplia 
esse assunto para verificar como podemos pre- 
ver uma variavel de safda categorica utilizan- 
do a regressao logistica. E um tema diffcil (de 
fato, eu poderia te-lo enchido de quadros do 
Alex Esperto, mas nao o fiz!) e a regressao lo- 
gfstica nao e um dos meus pontos fortes, assim, 
provavelmente escrevi algumas bobagens. No 
entanto, comecamos com um pouco de teoria 
para ajuda-lo a entender a regressao logistica, 
antes de irmos direto para um exemplo. Voce 
ira aprender a executar a regressao logistica no 
SPSS e a interpretar a safda resultante. Con- 
clufmos o capftulo com um segundo exemplo 
e usaremos esse exemplo a fim de ver como 
combater a multicolinearidade. Ao longo do 
texto, tambem descobriremos por que a selccao 
de futebol inglesa nao sabe cobrar penaltis. 

6.2 PRESSUPOSTOS DA REGRESSAO 
LOGISTICA © 

Em poucas palavras, a regressao logistica 
e uma regressao multipla, mas com uma varia¬ 


vel de safda categorica dicotomica e variaveis 
previsoras contfnuas ou categoricas. Simplifi- 
cando, isso quer dizer que podemos prever a 
qual de duas categoriais e provavel que uma 
pessoa pertenga dado certas informagoes. Um 
exemplo trivial e determinar que variaveis 
podem definir se uma pessoa e homem ou 
mulher. Voce podera mensurar a preguiga, a 
estupidez, o consumo de alcool, o numero de 
arrotos que a pessoa da em um dia. Utilizando 
a regressao logistica, podemos verificar que 
todas essas variaveis sao capazes de prever o 
genero de uma pessoa, e a tecnica nos aponta- 
ra tambem se uma pessoa tem certa probabili- 
dade de ser homem ou mulher. Assim, se voce 
pegar uma pessoa ao acaso e descobrir que ela 
teve um escore alto em preguiga, estupidez, 
consumo de alcool e numero de arrotos, entao 
o modelo de regressao podera nos dizer, com 
base nessa informagao, quao provavel e que 
essa pessoa seja homem. 

E improvavel que um pesquisador esteja 
interessado no relacionamento entre flatulencia 
e genero (isso e suficientemente comprovado 
pela experiencia para justificar uma pesquisa!), 
mas a regressao logistica pode ter aplicagoes 
vitais. Na literatura biomedica (isto e, pesquisa 
medica), a regressao logistica tem aplicagoes 
tais como a de formular modelos sobre os tipos 
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de fatores que determinam se um tumor e can- 
cerfgeno ou benigno. Uma base de dados de 
pacientes pode ser utilizada para identificar as 
variaveis que sao influentes na previsao do tipo 
de um tumor. Essas variaveis podem entao ser 
mensuradas em um novo paciente e seus valo- 
res colocados no modelo de regressao logfstica 
a partir do qual e possfvel estimar uma proba- 
bilidade de o tumor ser maligno. Se a probabi- 
lidade do tumor ser maligno e baixa, o medico 
pode decidir nao executar uma cara e dolorosa 
cirurgia que seria desnecessaria. 

Nas ciencias sociais, raramente enfrenta- 
mos decisoes de vida ou morte, mas mesmo 
assim a regressao logfstica e uma ferramen- 
ta bastante util. Por esse motivo, e triste que 
muitos livros-texto abordem o tema superfi- 
cialmente. Neste capftulo, explicarei os prin- 
cfpios por tras da regressao logfstica e como 
executar os procedimentos no SPSS. 

6.3 QUAIS SAO OS PRINCIPIOS POR 
TRAS DA REGRESSAO LOGISTICA? ® 

Nao pretendo entrar nos princfpios subja- 
centes da regressao logfstica porque eles nao 
sao necessarios para entender o teste (eu sou 
uma prova viva disso). Contudo, quero fazer 
algumas comparagoes com a regressao usual 
a fim de inserir a regressao logfstica em uma 
estrutura que seja familiar a qualquer um que 
tenha chegado ate aqui no livro. (O que? Voce 
nao leu o capftulo de regressao ainda?!) Se 
voce tem fobia de equagoes, e melhor olhar 
para o outro lado. Em uma regressao linear 
simples, vimos que a variavel de safda Y e pre¬ 
vista a partir da equagao da linha: 

Y = b 0 + b\X + e (6.1) 

Onde b 0 e o intercepto eb l e o gradiente 
da linha, Xe o valor da variavel previsora e e e 
o termo resfduo. Dados os valores de YeX, os 
parametros desconhecidos na equagao podem 
ser estimados encontrando-se a solugao para a 
qual as distancias ao quadrado entre os valo¬ 
res observados e previstos da variavel depen- 
dente sejam mfnimas (metodo dos mfnimos 
quadrados). 


Esse assunto deve ser bem familiar. Na re¬ 
gressao multipla - em que existem varios previ- 
sores, - uma equagao semelhante e derivada na 
qual cada previsor tem seu proprio coeficiente. 
Como tal, Y e previsto a partir de uma combi- 
nagao de cada variavel previsora multiplicada 
pelo seu respectivo coeficiente de regressao: 

Y = b 0 + b l X 1 + bnX -2 + ... + b lt X n + e (6.2) 

Onde b„ e o coeficiente de regressao da 
correspondente variavel X n . Na regressao lo¬ 
gfstica, em vez de se prever o valor da variavel 

Y a partir de um previsor X ou diversas varia¬ 
veis previsoras (Xs), prevemos a probabilidade 
de Y ocorrer conhecidos os valores de X ou Xs. 
A equagao de regressao logfstica apresenta va- 
rias semelhangas com a equagao de regressao 
recem-descrita. Na sua forma mais simples, 
quando existe um unico previsor X, a equagao 
de regressao logfstica a partir da qual a proba¬ 
bilidade da variavel Y e prevista e dada por: 

P(Y) = --- (6.3) 

1 + £ — (bo + b^X + Ej) 

Onde P(Y) e a probabilidade de Y ocorrer, 
e e a base dos logaritmos naturais e os demais 
coeficientes da equagao formam uma combi- 
nagao linear muito semelhante a regressao sim¬ 
ples. De fato, voce pode ter notado que a parte 
da equagao dentro dos parenteses e identica a 
regressao linear, pois existe uma constante ( b 0 ), 
uma variavel previsora (X) e um coeficiente 
(ou peso) agregado ao previsor (b{). Da mesma 
forma que para a regressao linear, e possfvel 
estender essa equagao para incluir diversas va¬ 
riaveis previsoras. Quando isso ocorre, a equa¬ 
gao toma a seguinte forma: 


A equagao (6.4) e a mesma utilizada 
quando existe um unico previsor, exceto que 
a combinagao linear foi estendida para incluir 
qualquer niimcro de previsores. Assim, en- 
quanto que a versao com um previsor da equa¬ 
gao de regressao logfstica content a equagao 
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de regressao linear simples em seu interior, 
a versao com multiplos previsores content a 
equagao de regressao multipla. 

A despeito das seme- 
Ihancas entre a regressao 
linear e a logfstica, existe 
uma boa razao porque nao 
podemos aplicar a regres¬ 
sao linear diretamente a 
uma situagao onde a varia- 
vel de safda e dicotomica: 
uma das hipoteses da re¬ 
gressao linear e que o relacionamento entre as 
variaveis e linear (veja a Segao 5.6.2.1). Vimos 
anteriormente a importancia das hipoteses para 
se obter um modelo preciso. Portanto, para o 
modelo de regressao linear ser valido, os dados 
observados devem ter um relacionamento li¬ 
near. Quando a variavel de safda e dicotomica, 
essa hipotese e normalmente violada (veja Ber¬ 
ry, 1993). Uma forma de contornar esse proble- 
ma e alterar os dados por meio de uma transfor- 
magao logarftmica (veja Berry e Feldman, 
1985, Capftulo 3). Isso mantem a forma do rela¬ 
cionamento linear enquanto o proprio relacio¬ 
namento em si e nao-linear (assim, e um modo 
de expressar um relacionamento nao-linear em 
uma maneira linear). A equagao de regressao 
logfstica descrita anteriormente esta baseada no 
seguinte princfpio: ela expressa uma equagao 
de regressao linear multipla em termos logarft- 
micos e dessa forma resolve o problema da vio- 
lagao da hipotese de linearidade. 

A forma exata da equagao pode ser arran- 
jada de varias maneiras, mas a versao que eu 
escolhi expressa a equagao em termos da pro- 
babilidade de Y ocorrer (isto e, a probabilidade 
de que um caso pertenga a uma determinada ca- 
tegoria). O valor resultante da equagao e a uma 
probabilidade e, como tal, varia sempre entre 
0 e 1. Um valor proximo de 0 significa que a 
ocorrencia de Y e bastante improvavel e um va¬ 
lor proximo de 1, que ela e bem provavel. Alem 
disso, da mesma forma que na regressao linear, 
na equagao logfstica cada variavel previsora 
tern seu proprio coeficiente. Quando executa- 
mos a analise precisamos estimar os valores 
desses coeficientes para que possamos utilizar a 


equagao. Esses parametros sao estimados pelo 
ajustamento de modelos, com base nos previ¬ 
sores disponfveis, aos dados observados. O mo¬ 
delo escolhido sera aquele que quando os va¬ 
lores das variaveis previsoras forem utilizados 
resulta em um valor de Y mais proximo do valor 
observado. Especificamente, os valores dos pa¬ 
rametros sao estimados utilizando a estimagao 
de maxima verossimilhanga que seleciona os 
coeficientes que tornam os valores observados 
mais provaveis de terem ocorrido. Assim como 
ocorreu com a regressao multipla, tentamos 
ajustar um modelo aos nossos dados que nos 
permita estimar valores da variavel de safda a 
partir de valores das variaveis previsoras. 

6.3.1 Avaliando o modelo: a estatistica 
de verossimilhanga-log <D 

Como vimos, o modelo de regressao lo¬ 
gfstica preve a probabilidade de um evento 
ocorrer para uma dada pessoa (representarfa- 
mos isso como P(fj), a probabilidade de que 
Y ocorra para a pessoa f), baseado em obser- 
vagoes de se um evento ocorreu ou nao para 
essa pessoa (representarfamos isso como Y ; ,, a 
safda real para a i-esima pessoa). Assim, para 
uma dada pessoa, Y podera ser 0 (a safda nao 
ocorre) ou 1 (a safda ocorre), e o valor pre- 
visto, P(Y), sera um valor entre 0 (nao exis¬ 
te possibilidade de que a safda ocorra) e 1 (a 
safda ocorrera). Vimos na regressao multipla 
(consulte o capitulo anterior) que para avaliar 
se um modelo adere aos dados, comparamos 
os valores observados e os previstos (se voce 
lembrar, utilizamos R 2 , que e a correlagao 
de Pearson ao quadrado entre os valores ob¬ 
servados de safda e os valores previstos pelo 
modelo de regressao). Da mesma forma, na 
regressao logfstica, podemos utilizar os valo¬ 
res observados e previstos para avaliar a ade- 
rencia do modelo. Para fazer isso, utilizamos a 
verossimilhanga-log (VL): 

verossimilhanga-log = 

Ew))+a■-wi- m )ii (6-5) 

i=i 
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A verossimilhanga-log e, portanto, ba- 
seada na soma das probabilidades associadas 
com a safda real e a prevista (ver Tabachnick e 
Fidell, 2001). A estatfstica de verossimilhanga- 
log e analoga a soma dos resfduos ao quadrado 
na regressao multipla, no sentido de que ela e 
um indicador de quanta informagao nao expli- 
cada ainda existe apos o modelo ter sido ajus- 
tado. Como conseqfiencia, tem-se que valores 
altos da estatfstica de verossimilhanga-log in¬ 
dicam uma aderencia pobre do modelo, por- 
que quanto maior for esse valor, mais observa- 
coes nao explicadas existirao. 

E possfvel calcular a verossimilhanga-log 
para diferentes modelos e comparar esses mo- 
delos por meio das diferengas entre os resulta- 
dos da estatfstica de verossimilhanga-log. Um 
uso para isso e comparar o estado do modelo 
de regressao contra algum tipo basico de esta¬ 
do. O estado basico utilizado e normalmente 
o modelo quando apenas a constante esta in- 
clufda. Na regressao multipla, o modelo basi¬ 
co utilizado foi a media de todos os valores da 
variavel Y (ela era a nossa melhor estimativa 
quando nenhuma outra informagao estava dis- 
ponfvel). Na regressao logfstica, se quisesse- 
mos prever um resultado, qual seria o nosso 
melhor palpite? Bern, nao podemos utilizar 
os valores de safda porque eles sao formados 
por Os e Is e, assim, a media nao tem sentido! 
Contudo, se soubermos a frequencia de Os e 
Is, nosso melhor palpite seria a categoria com 
o maior numero de casos. Dessa forma, se um 
valor de safda ocorre 107 vezes e nao ocorre 
em 72 vezes, nossa melhor estimativa seria de 
que ele ira ocorrer (porque temos 107 ocorren- 
cias contra 72 nao-ocorrencias). Como tal, em 
uma regressao multipla, nosso modelo base 
nos da a melhor previsao na falta de qualquer 
outra informagao: na regressao logfstica, essa 
mesma situagao seria prever a safda que ocor¬ 
re com maior freqiiencia. Esse e o modelo de 
regressao logfstica quando apenas a constante 
for inclufda. Se adicionarmos um ou mais pre- 
visores ao modelo, podemos calcular a melho- 
ria do modelo da seguinte forma: 


x 2 = 2[VL(Novo) - VL(Basico)] (6.6) 

^Novo — ^Basico) 

Assim, simplesmente pegamos o novo mo¬ 
delo e o subtrafmos do modelo basico (o mode¬ 
lo quando somente a constante esta presente). 
Voce deve ter notado que multiplicamos esse 
valor por 2; fazemos isso porque ele e um resul¬ 
tado da distribuigao qui-quadrado (veja o Ca- 
pftulo 16 e o Apendice A4) e, dessa forma, fica 
facil calcular a significance do valor. A distri¬ 
buigao qui-quadrado que utilizamos tem graus 
de liberdade igual ao numero de parametros no 
novo modelo menos o numero de parametros no 
modelo basico. O numero de parametros, k, no 
modelo basico e sempre igual a 1 (a constante 
e o unico parametro a ser estimado) e qualquer 
modelo subseqiiente tera um numero de graus 
de liberdade igual ao numero de previsores 
mais 1 (isto e, o numero de previsores mais o 
parametro representando a constante). 


6.3.2 Avaliando o modelo: R eR 2 ® 

Quando falamos so- 
bre regressao linear, vi- 
mos que o coeficiente de 
correlagaomultiplo Re o 
correspondente R 2 foram 
medidas uteis para ava- 
liar como o modelo se 
ajustava aos dados. Vi- 
mos tambem que a razao 
de verossimilhanga e semelhante no sentido 
de que ela esta baseada no nfvel de correspon- 
dencia entre os valores de safdas previstos e 
observados. Contudo, e possfvel calcular uma 
versao mais adequada da correlagao multipla 
na regressao logfstica por um valor conhecido 
como estatfstica-R. Essa estatfstica-R e a cor¬ 
relagao parcial entre a variavel de safda e cada 
uma das variaveis previsoras e podem variar 
de — 1 a 1. Um valor positivo indica que quan¬ 
do a variavel previsora aumenta, tambem au- 
menta a probabilidade da ocorrencia do even- 
to. Um valor negativo indica que se a variavel 
previsora aumenta, a probabilidade do valor 
de safda ocorrer diminui. Se uma variavel tem 
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um valor pequeno de R, entao ela contribui 
pouco para o modelo. 

O calculo de R e fornecido na equagao 
(6.7). O —2VL e o —2 verossimilhanga-log 
para o modelo original, a estatistica de Wald 
e calculada como o descrito na proxima segao 
e os graus de liberdade podem ser lidos na ta- 
bela resumo das variaveis na equagao. Contu- 
do, em virtude do valor de R ser dependente 
da estatistica de Wald, ele nao e uma medida 
precisa (veremos na proxima segao que a esta¬ 
tistica de Wald pode nao ser precisa em certas 
circunstancias). Por esse motivo, o valor de R 
deve ser tratado com alguma cautela e e inva- 
lido eleva-lo ao quadrado e interpreta-lo como 
foi feito na regressao linear. 

Wald — (2 x gl) 

---— (6.7) 

-2VL(Original) 

Existe controversia sobre o que seria um 
bom valor semelhante ao R 1 da regressao li¬ 
near, mas uma medida descrita por Hosmer 
e Lemeshow (1989) pode ser facilmente cal¬ 
culada. Na terminologia do SPSS, o Ry de 
Hosmer e Lemeshow e calculado como na 
equagao (6.8): 

^VL(Modelo) 

—2VL(Original) 

Como tal, o Ry 6 calculado pela divi- 
sao do qui-quadrado do modelo (baseado na 
verossimilhanga-log) pelo -TVL-original (a 
verossimilhanga-log para o modelo antes que 
qualquer previsor tenha sido adicionado). O 
Ry€ a redugao proporcional no valor absoluto 
da medida verossimilhanga-log e, desse modo, 
e uma medida de quanto a nao-aderencia au- 
menta como resultado da inclusao de uma va¬ 
riavel previsora. Ele pode variar de 0 (indican- 
do que os previsores sao inuteis na previsao da 
variavel de saida) a 1 (indicando que o modelo 
preve perfeitamente a variavel de safda). 

Contudo, essa nao e a medida utilizada 
pelo SPSS. O SPSS utiliza o R 2 S de Cox e 
Snell (1989), que e baseado na verossimilhan¬ 
ga-log do modelo (VL(Novo)) e a verossimi¬ 


lhanga-log do modelo original (VL(Basico)) e 
o tamanho da amostra, n: 

D 2 i [--(VL(Novo)-VL(Basico))] 

Res = 1 — " J (6.9) 

Contudo, essa estatistica nunca alcan- 
ga o seu valor teorico maximo, 1. Portanto, 
Nagelkerke (1991) sugeriu a seguinte corre- 
gao (Ry de Nagelkerke): 

= r 2(VL(Basico)T (6.10) 

1 — e- " J 

Embora todas essas medidas tenham dife- 
rengas na forma de calculo (e nos resultados), 
coletivamente e possrvel considera-las como 
praticamente as mesmas. Assim, em termos 
de interpretagao elas podem ser vistas como 
similares ao R 2 da regressao linear no sentido 
de fornecer uma medida do grau de aderencia 
do modelo. 

6.3.3 Avaliando a contribuicao dos 

previsores: a estatistica de Wald © 

Como na regressao linear, queremos sa¬ 
ber nao apenas se o modelo se ajusta bem aos 
dados, mas tambem a contribuigao individual 
de cada um dos previsores. Na regressao li¬ 
near, utilizamos os coeficientes estimados da 
regressao ib) e seus erros padrao para calcu- 
lar a estatistica t. Na regressao logistica, existe 
uma estatistica analoga a de Wald que apresen- 
ta uma distribuigao especial conhecida como 
qui-quadrado. Da mesma forma que o teste 
t na regressao linear, a estatistica de Wald nos 
informa se o coeficiente b de cada previsor e 
significativamente diferente de zero. Se isso 
ocorrer, poderemos assumir que o previsor esta 
contribuindo de forma significativa para a pre¬ 
visao da variavel de saida (Y). A equagao (6.11) 
mostra como a estatistica de Wald e calculada 
e e possivel ver que basicamente ela e igual a 
estatistica t na regressao linear (veja a equagao 
(5.6)); ela e o valor do coeficiente de regres¬ 
sao dividido pelo seu erro padrao associado. A 
estatistica de Wald e geralmente utilizada para 
determinar se uma variavel e um previsor signi- 
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ficativo da safda; contudo, ela e provavelmente 
mais precisa para examinar a estatfstica da ra- 
zao de verossimilhanqa. A estatfstica de Wald 
(Figura 6.1) deve ser vista com cautela porque 
quando o coeficiente de regressao (b) e grande, 
o erro padrao tende a ficar inflacionado, resul- 
tando em uma estatfstica de Wald subestimada 
(veja Menard, 1995). A inflaqao do erro padrao 
aumenta a probabilidade de que o previsor seja 
rejeitado quando na realidade ele contribui para 
o modelo (isto e, voce tem uma probabilidade 
maior de cometer o erro do Tipo II). 



6.3.4 Exp A ® 

O mais importante para a interpretagdo da 
regressao logfstica e o valor da exp b (Exp(B) 
na safda do SPSS), e um indicador da mudan- 
ca nas probabilidades resultantes da mudan- 
qa de uma unidade no previsor. Ele e similar 
aos coeficientes b da regressao logfstica, mas 
mais facil de entender (porque nao requer uma 
transformaqao logarftmica). Quando a variavel 
previsora e categorica, o exp b e mais facil de 
explicar; assim, imagine que temos um exem- 
plo simples no qual estamos tentando prever a 
possibilidade de gravidez de uma mulher a par- 



Figura 6.1 Abraham Wald escrevendo "eu 
nao devo construir estatisticas teste propensas 
a ter erros padrao inflados" no quadro-negro 
cem vezes. 


tir da informaqao do uso ou nao de preservative 
pelo parceiro com quem ela se relacionou. A 
chance de um evento ocorrer e definida como a 
probabilidade dele ocorrer dividida pela proba¬ 
bilidade dele nao ocorrer (veja a equacao 6.12) 
e nao deve ser confundida com a forma mais 
coloquial da palavra que se refere a probabili¬ 
dade. Assim, por exemplo, a chance de engra- 
vidar e a probabilidade de engravidar dividida 
pela probabilidade de nao engravidar: 

/ J ( even to ocorrer) 

Chance =- 

P (evento nao ocorrer) 

P(eventoF)= i + ^ W) (6.12) 

p/evento Y ^ p/evento Y\ 

\nao ocorrer J ~ \ocorrer ) 

Para calcular a mudanqa na chance que re- 
sulta da mudanqa de uma unidade no previsor, 
primeiro precisamos calcular as chances de en¬ 
gravidar quando nao foi utilizado preservative. 
Depois calculamos as chances de engravidar 
quando foi usado preservative. Finalmente, cal¬ 
culamos a prcporqao entre essas duas chances. 

Para calcular o primeiro conjunto de chan¬ 
ces, precisamos utilizar a equaqao (6.3) a fim de 
calcular a probabilidade de engravidar quando 
nao foi utilizado preservative. Se tivessemos 
mais do que um previsor, usarfamos a equaqao 
(6.4). Existem tres quantidades desconhecidas 
nessa equaqao: o coeficiente da constante (£>„), o 
coeficiente do previsor (b t ) e o valor do proprio 
previsor (X). Saberemos o valor de A a partir de 
como foi codificada a variavel de utilizacao do 
preservativo (as chances sao: nao utilizado = 0 
e utilizado = 1). Os valores de b 0 e b l serao es- 
timados por nos. Podemos calcular as chances 
como na equaqao (6.12). 

Em seguida, fazemos o mesmo calculo 
apos a variavel previsora ter mudado em uma 
unidade. Nesse caso, em virtude do previsor ser 
dicotomico, precisamos calcular a chance de 
gravidez dado que o preservativo foi utilizado. 
Assim, o valor de X agora e 1 (em vez de 0). 

Nos conhecemos as chances antes e de¬ 
pois da mudanqa de uma unidade na variavel 
previsora. E apenas uma questao de calcular a 
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mudanca proporcional nas chances que pode 
ser feita dividindo as chances apos a mudan- 
5 a de uma unidade na variavel previsora pelas 
chances antes de tal mudanga. 


Probabilidade apos 
a mudanca de uma 

. unidade no previsor 

AChance =--- 

Probabiliadade original 


(6.13) 


Essa proporgao de mudanca na chance 
e o exp b, assim, podemos interpretar o exp 
b em relagao a mudanca na chance: se o va¬ 
lor e maior do que 1 significa que quando o 
previsor aumenta, as chances da saida ocorrer 
aumentam. Ja um valor menor do que 1 indica 
que quando o previsor aumenta, as chances da 
saida ocorrer diminuem. Logo fornecerei um 
exemplo real de como isso funciona. 


6.3.5 Metodos de regressao logistica © 

Assim como na regressao multipla, exis- 
tem varios metodos diferentes que podem ser 
utilizados na regressao logistica. 


6.3.5.1 0 metodo da entrada forgada 

O metodo padrao de conduzir essa regres¬ 
sao e o “enter”. Ele e o mesmo que a entrada 
forgada da regressao multipla, em que todas 
as covariaveis sao colocadas no mesmo mo- 
delo de regressao em um unico bloco e as es- 
timativas dos parametros sao calculadas para 
cada bloco. Alguns pesquisadores acreditam 
que esse metodo e o unico apropriado para 
testar teorias (Studenmund e Cassidy, 1987) 
porque a tecnica passo a passo e influenciada 
por variagoes aleatorias nos dados e raramente 
fornece resultados replicaveis se o modelo e 
novamente executado com a mesma amostra. 


6.3.5.2 Metodos passo a passo ( stepwise ) 

Se voce nao ficou assustado com as cri- 
ticas aos metodos passo a passo no capitulo 
anterior, pode selecionar tanto o metodo para 
frente quanto o para tras. Quando o metodo 
para frente e empregado, o computador inicia 
com um modelo que inclui apenas a constan- 


te e depois adiciona os previsores um a um no 
modelo com base em criterios especificos. Esse 
criterio e o valor da estatistica escore: a varia¬ 
vel com a estatistica escore mais significativa 
e adicionada ao modelo. O computador segue 
ate que nenhum dos previsores restantes tenha 
uma estatistica escore significativa (o ponto 
de corte da significancia inicia com 0,05). A 
cada passo, o computador tambem examina as 
variaveis no modelo para ver se alguma deve 
ser removida. Ele faz isso em uma das tres se- 
guintes maneiras. A primeira e utilizar a esta¬ 
tistica Razao de Verossimilhanga descrita em 
16.2.2 (o metodo RV para a frente), em que o 
modelo atual e comparado ao modelo quando 
o previsor e removido. Se a remogao do pre¬ 
visor acarreta uma diferenga significativa para 
o ajuste do modelo aos dados observados, o 
computador retem o previsor (porque o modelo 
fica melhor quando o previsor e incluido). Se, 
contudo, a remogao do previsor acarreta uma 
diferenga muito pequena no modelo, o com¬ 
putador rejeita o previsor. Em vez de utilizar 
a estatistica da razao de verossimilhanga, que 
estima o quao bem o modelo adere aos dados 
observados, o computador pode utilizar uma 
estatistica condicional como um criterio de 
remogao ( Condicional: para frente). Essa es¬ 
tatistica e uma versao aritmeticamente menos 
intensa que a estatistica da razao de verossimi¬ 
lhanga, assim, nao ha muita vantagem em uti- 
liza-la. O criterio final e a estatistica de Wald, 
na qual cada previsor no modelo que tem um 
valor significativo da estatistica de Wald (aci- 
ma do criterio padrao de remogao de 0 , 1 ) sera 
removido. Entre esses metodos, o melhor e o 
da estatistica da razao de verossimilhanga, pois 
a estatistica de Wald pode, as vezes, nao ser 
confiavel (Segao 6.3.3). 

O oposto do metodo para a frente e o para 
tras. Esse metodo utiliza os mesmos tres cri¬ 
terios de remogao, mas em vez de comegar o 
modelo somente com uma constante ele co- 
mega com todos os previsores incluidos. O 
computador entao testa se qualquer um dos 
previsores podera ser removido sem causar 
um efeito substancial no grau de aderencia do 
modelo aos dados observados. O previsor que 
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apresentar o menor impacto no ajuste do mo- 
delo aos dados sera removido primeiro. 

6.3.5.3 Como selecionamos um metodo? © 

Da mesma forma 
que a regressao li¬ 
near (capftulo ante¬ 
rior), o metodo de 
regressao escolhido 
dependera de varios 
fatores. A principal 
consideragao e se 
voce esta testando uma teoria ou esta fazendo 
um trabalho exploratorio. Como ja foi dito, al- 
gumas pessoas acreditam que os metodos pas- 
so a passo ( stepwise ) nao sao bons para testar 
teorias. Contudo, os metodos passo a passo sao 
apropriados quando nao existem pesquisas 
previas que podem ser tomadas por base para 
testar hipoteses e em situates onde a causali- 
dade nao e de interesse e voce quer somente 
achar um modelo para ajustar os dados (Me¬ 
nard, 1995; Agresti e Finlay, 1986). Tambem, 
como foi colocado para a regressao linear, se 
voce decidir utilizar um metodo passo a passo, 
o metodo para tras ( backward ) e preferfvel ao 
metodo para frente (forward). Isso e em virtu- 
de do efeito supressor, que ocorre quando um 
previsor tem um efeito significativo somente 
quando outra variavel e mantida constante. A 
selecao para frente e mais provavel que a eli- 
minagao para tras para excluir previsores en- 
volvidos em efeitos supressores. Desse modo, 
o metodo oferece um alto risco de se cometer o 
Erro do Tipo II. Em termos da estatistica teste 
utilizada em metodos passo a passo, a estatisti¬ 
ca de Wald tende a ser pouco precisa em certas 
circunstancias (veja a Segao 6.3.3), portanto, a 
razao de verossimilhanga e melhor. 

6.4 EXECUTANDO A ANALISE: UM 
EXEMPLO DE PESQUISA © 

Como meu primeiro exemplo de pesquisa, 
vou apresentar um de psicologia do desenvol- 
vimento. Um bom exemplo de uma variavel 
dicotomica e passar ou nao em um teste, que 


em termos de psico¬ 
logia do desenvolvi- 
mento e referido como 
tendo ou nao uma de- 
terminada habilidade 
cognitiva. Esse exem¬ 
plo esta relacionado 
com o entendimento 
de regras de desen- 
volvimento por uma 
crianga com base na sua idade e se a crianga 
apresenta uma teoria da mente. Simplificando, 
uma regra de desenvolvimento e uma conven- 
gao de demonstragao de uma emogao apro- 
priada em uma dada situagao. Por exemplo, 
se voce ganha um presente de Natal que nao 
gosta, a regra apropriada de comportamento e 
sorrir polidamente e dizer “obrigado tia Kate, 
eu sempre quis um repolho podre”. O compor¬ 
tamento emocional inapropriado e comegar a 
chorar e gritar “por que voce me comprou um 
repolho podre, sua velha chata?”. Existem al- 
gumas evidencias de que criangas pequenas 
nao tem um entendimento do comportamento 
apropriado e isso esta conectado a teoria do 
desenvolvimento do cerebro (que e simples- 
mente a habilidade de entender o que a outra 
pessoa pode estar pensando). 

Para esse exemplo, nossos pesquisadores 
estao interessados em saber se o entendimen¬ 
to das regras de desenvolvimento emocionais 
esta relacionado a ter uma teoria da mente. 
Eles acreditam que uma crianga precisa en¬ 
tender como outra pessoa pensa para perce- 
ber como o seu comportamento emocional ira 
afetar essa pessoa: se voce nao conseguir se 
imaginar no lugar da tia Katie, entao voce nao 
ira entender que ela podera ficar muito cha- 
teada se voce chama-la de velha chata. Para 
testar essa teoria, foi atribuida a varias crian¬ 
gas uma tarefa padrao de falsas crengas (uma 
tarefa usada para medir se alguem tem uma 
teoria da mente) em que elas poderiam passar 
ou nao e suas idades em meses foram medi- 
das. Alem disso, a cada crianga foi dada uma 
tarefa com uma regra de comportamento que 
elas poderiam tambem passar ou nao. Assim, 
as seguintes variaveis foram mensuradas: 
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• Saida (variavel dependente): ter um en- 
tendimento das regras de comportamento 
(a crianga passou no teste: Sim/Nao?). 

• Previsor (variavel independente): ter ou 
nao uma teoria da mente (a crianga passou 
na tarefa de falsas crengas: Sim/Nao?). 

• Previsor (variavel independente): Idade 
em meses. 

Nesse experimento, existe uma variavel 
de saida dicotomica, um previsor categorico 
e um previsor continuo. O cenario e ideal para 
uma regressao logistica. 

6.4.1 A analise principal © 

Para executar uma regressao logistica, 
a entrada dos dados deve ser feita como na 
regressao linear: eles sao arranjados no edi¬ 
tor de dados em tres colunas (uma para cada 
variavel). Os dados pode ser encontrados 
no arquivo display.sav na pasta do Capitulo 
6 no site www.artmed.com.br. Ao observar 
o editor de dados, voce devera notar que as 
duas variaveis categoricas entraram como va¬ 
riaveis codificadas (veja a Segao 2.4.4); isto 
e, os numeros foram especificados como re- 
presentantes de categorias. Para facilitar a in- 
terpretagao, a variavel de saida deve ser co- 
dificada como 1 (evento ocorreu) e 0 (evento 
nao ocorreu); neste caso, 1 representa ter um 
entendimento das regras de comportamento e 
0 representa a ausencia de compreensao das 


regras. Para a tarefa das falsas crengas, um 
codigo semelhante foi utilizado (1 = passou 
na tarefa das falsas crengas e 2 = falhou na 
tarefa das falsas crengas). A regressao logisti¬ 
ca esta localizada em Regression (Regressao), 
que e acessado pelo menu Analyze (Anali- 
sar): Analyzes Regressions Binary logistic 
(AnalisarsRegressaosLogistica Binaria). 
Seguindo esse caminho a caixa de dialogo 
principal para a regressao logistica sera ativa- 
da conforme mostrado na Figura 6.2. 

A caixa de dialogo principal e semelhan¬ 
te a da regressao padrao. Existe um espago 
para colocar a variavel dependente (variavel 
de saida). Nesse exemplo, a saida e o enten¬ 
dimento ou nao das regras de comportamento, 
assim, voce simplesmente pode clicar em dis¬ 
play e transferi-la para o quadro Dependent 
(Dependente) clicando em _lI. Existe tambem 
um quadro para especificar as covariaveis (as 
variaveis previsoras). E possivel especificar os 
efeitos principals e as interagoes na regressao 
logistica. Para especificar um efeito principal, 
selecione um previsor (por exemplo, age [ida¬ 
de]) e transfira essa variavel para o quadro de- 
nominado Covariates (Covariaveis) clicando 
em jJ. Para entrar com uma interagao, clique 
em mais de uma variavel no lado esquerdo da 
caixa de dialogo (por exemplo, marque duas 
ou mais variaveis) e depois clique em ^ a 
fim de move-las para o quadro das Covariates 
(Covariaveis). Nesse exemplo, existem apenas 



Figura 6.2 Caixa de dialogo principal da regressao logistica. 
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dois previsores, portanto, existe apenas uma 
possfvel interagao (a interagao entre idade 
[age] x falsas crengas [fb]), mas se voce ti- 
ver tres ou mais previsores, podera selecionar 
varias interagoes dois a dois assim como a in¬ 
teragao das tres variaveis. 

6.4.2 Metodos de regressao © 

Assim como na regressao multipla, exis- 
tem varios metodos diferentes que podem ser 
utilizados na regressao logfstica (veja a Se¬ 
gao 6.3.5). Voce pode selecionar um metodo 
especifico de regressao clicando na seta que 
aponta para baixo proxima ao quadro denomi- 
nado Method (Method). A Figura 6.3 mostra 
parte do menu da regressao logfstica quando 
os metodos de regressao estao ativos. Para 
essa analise, selecione o metodo Forward.LR. 
Depois de eu ter escrito que voce nunca de- 
veria fazer analises passo a passo, voce deve 
estar achando um tanto estranho eu sugerir a 
utilizagao do metodo para a frente (forward) 
aqui. Bern, esse estudo e o primeiro na area 
e, assim, nao existem pesquisas previas que 
nos apontem quais previsores sao confiaveis. 
Tambem, ainda nao lhe mostrei um exemplo 
de regressao passo a passo, portanto, essa sera 
uma maneira util de demonstrar como o pro- 
cedimento funciona! 

6.4.3 Previsores categoricos © 

Nesse exemplo, existe uma variavel pre- 
visora categorica. Uma das qualidades da re¬ 
gressao logfstica e que ela aceita previsores 
categoricos. Contudo, e necessario indicar ao 
SPSS quais variaveis, se existirem, sao catego- 
ricas, clicando em c***-"-* na caixa de dialogo 
da regressao logfstica para ativar uma nova 
caixa de dialogo semelhante a da Figura 6.4. 


Method 

FotwardLR ^ 


Forward Conditional 


Catego<« 



ForwatdWald 
Backward: Conditional 
BackwardLR 
BackwardWald 



, 


Figura 6.3 Metodos de regressao. 


Nessa caixa de dialogo, as covariaveis estao 
listadas no lado esquerdo e existe um quadro 
na direita no qual as covariaveis categoricas 
podem ser colocadas. Destaque as variaveis 
categoricas que voce tern (nesse exemplo, cli¬ 
que na lb) e transfira-as para o quadro Cate¬ 
gorical Covariates (Covariaveis Categoricas) 
clicando em _lI. Na Figura 6.4, a fb, ja esta 
selecionada e transferida. 

Existem varias maneiras de tratar previso¬ 
res categoricos; por padrao, o SPSS ira utilizar 
os desvios dos contrastes em todas as varia¬ 
veis categoricas. Na Segao 5.10 do capftulo 
anterior, vimos que os previsores categoricos 
poderiam ser incorporados na regressao pela 
codificagao dos seus valores em zeros e uns 
(conhecido como codigo auxiliar - dummy). 
Agora existem maneiras diferentes de arranjar 
esses codigos dependendo do que voce quer 
comparar. O SPSS tern varias formas padroni- 
zadas que poderao ser selecionadas (apresen- 
taremos esses metodos em mais detalhes no 
Capftulo 8). Por padrao, o SPSS utiliza a codi¬ 
ficagao Indicator (Indicador), que e a variavel 
auxiliar (dummy) padrao que ja foi explicada 
na Segao 5.10 (e voce pode escolher ainda a 
sua primeira ou ultima categoria como base). 
Se quiser mudar para um tipo diferente de con- 
traste, clique na seta que aponta para baixo no 
quadro Change Contrast (Mudar contraste). 
A Figura 6.5 mostra que e possfvel selecionar 
contrastes simples, de diferengas, de Helmert, 
repetidos, polinomiais e contrastes de desvios 



Figura 6.4 Definindo as variaveis categoricas 
na regressao logistica. 
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Figura 6.5 Selecionando contrastes para previsores categoricos. 


da mesma forma que na ANOVA (ver Tabela 
8.6). Essas tecnicas serao discutidas em deta- 
lhes no Capitulo 8, onde sera explicado o que 
um contraste faz. Contudo, voce nao ira pre- 
cisar dos contrastes indicadores naquele ca¬ 
pftulo, portanto, irei utiliza-lo aqui (como na 
Figura 6.4). Quando um contraste indicador e 
utilizado, os nrveis da variavel categorica sao 
recodificados utilizando uma variavel dummy 
padrao (veja as Segoes 5.10 e 7.8). 

6.4.4 Obtendo residuos © 

Como na regressao linear, e possivel soli- 
citar ao SPSS que determine um conjunto de 
residuos como novas variaveis no editor de 
dados. Essas variaveis-resfduos podem entao 
ser examinadas para veriftcar a qualidade do 
ajuste do modelo aos dados observados. Para 
salvar os residuos, clique em na caixa 

de dialogo principal da regressao logistica (Fi¬ 
gura 6.2). O SPSS salva cada uma das varia¬ 
veis selecionadas no editor de dados, mas elas 
podem ser listadas no visualizador de safdas 
utilizando o comando Case Summaries (Re¬ 
sumo de Casos) (veja a Segao 5.8.6) e sele¬ 
cionando as variaveis de interesse. A caixa de 
dialogo dos residuos ilustrada na Figura 6.6 
nos fornece varias opgoes; a maioria delas sao 
as mesmas da regressao multipla (veja a Se¬ 
gao 5.7.4). Dois tipos de residuos exclusivos 
da regressao logistica sao as probabilidades 
previstas ( predicted probabilities ) e a perti- 
nencia prevista ao grupo (predicted group me- 
berships). Essas probabilidades previstas sao 
as probabilidades de Y ocorrer dado o valor 
de cada previsor para um determinado parti- 
cipante. Elas sao derivadas da equagao (6.4) 


para um dado caso. A permanencia prevista ao 
grupo e autoexplicativa no sentido de que ela 
preve a qual das duas categorias de Y o parti- 
cipante tern a maior probabilidade de perten- 
cer com base no modelo. A permanencia ao 
grupo e baseada nas probabilidades previstas 
e explicarei esses valores mais detalhadamen- 
te quando formos interpretar os residuos. Vale 
a pena selecionar todas as opgoes disponrveis 
ou pelo menos as mesmas opgoes que apare- 
cem na Figura 6.6. 

O exame dos residuos depois de qualquer 
analise e extremamente importante. Uma das 
muitas vantagens dos pacotes computacionais 
em relagao a analise manual e que eles agili- 
zam a obtengao de diagnosticos residuais que 
de outra forma seriam dificeis de conseguir 
devido ao tempo gasto em calculos e pela al¬ 
gebra envolvida. No entanto, o avango com- 
putacional ainda nao atingiu o ponto otimo 
na consideragao dos residuos. Infelizmente, 
cientistas sociais, treinados a considerar ape- 
nas valores de probabilidade abaixo de 0,05 
desconsideram a analise dos residuos! Falei 
sobre a importancia de construir modelos pre- 
cisos e, tambem, que executar uma regressao 
sem conferir se o modelo se ajusta aos dados 
e como comprar calgas sem experimenta-las 
- eles podem parecer boas no cabide, mas 
quando voce as veste, em casa, ficam aper- 
tadas. As calgas podem cumprir seu objetivo 
(elas cobrem as pernas e esquentam), mas elas 
nao tem um valor real (porque elas cortam a 
circulagao do sangue nas suas pernas e em 
outras partes importantes). Da mesma forma, 
a regressao executa o seu trabalho a despeito 
dos dados - ela ira criar um modelo - mas o 
valor real do modelo sera limitado. 
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Figura 6.6 Caixa de dialogo para a determi- 
nagao de residuos na regressao. 


Testar o grau de aderencia com que o mo- 
delo se ajusta aos dados coletados e a essencia 
das estatfsticas de diagnostico. Se o modelo 
adere bem aos dados, podemos ter uma maior 
seguranga de que os coeficientes do modelo 
serao mais precisos e nao serao influenciados 
por uns poucos pontos que se desviam. Na 
melhor das hipoteses, falhas no exame dos 
residuos podem leva-lo a ignorar coeficientes 
pouco precisos no modelo. Na pior, esse mo¬ 
delo nao acurado pode ser utilizado para acei- 
tar hipoteses teoricas que sao, de fato, falsas. 

6.4.5 Opgoes adicionais © 

Existe uma caixa de dialogo final que 
oferece opgoes adicionais. Essa caixa e mos- 
trada na Figura 6.7 e e acessada clicando em 


s 3010 "* na caixa de dialogo principal da regres¬ 
sao logfstica. Em geral, as opgoes padrao sao 
suficientes. Mencionei na Segao 6.4.2 que 
quando o metodo passo a passo e utilizado, 
existe um criterio padrao para a selegao e a 
remogao de previsores no modelo. Esses cri- 
terios estao apresentados na caixa de dialogo 
options (opgoes) sob o tftulo Probability for 
Stepwise (Probabilidade para o passo a passo). 
A probabilidade limite pode ser alterada, mas 
ha necessidade, a menos que voce tenha uma 
boa razao para querer um criterio mais rfgido 
para a selegao de variaveis. Outro valor pa¬ 
drao e a chegada ao modelo apos um maximo 
de 20 itcragoes. Sempre que tentamos ajustar 
o melhor modelo possfvel aos nossos dados, e 
o numero maximo de iteragoes pode ser ima- 
ginado como o numero maximo de tentativas 
que o computador fara para encontrar esse 
melhor modelo. A menos que voce tenha um 
modelo bastante complexo, 20 iteragoes serao 
mais do que suficientes. Vimos, no Capftulo 
5, que as equagoes de regressao contem uma 
constante que representa o intercepto com Y 
(isto e, o valor de Y quando os valores dos pre¬ 
visores sao iguais a zero). Por padrao, o SPSS 
inclui a constante no modelo, mas e possfvel 
realizar a analise sem a constante, e isso tem 
o efeito de fazer o modelo passar pela origem 
(isto e, Y e zero quando X e zero). Dado que 
estamos interessados em produzir um modelo 



Figura 6.7 Caixa de dialogo para as opgoes da regressao logistica. 
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com o maximo de aderencia aos dados que co- 
letamos, nao ha motivo para fazer uma analise 
sem a constante incluida. 

Uma opgao util e o diagrama de classifi- 
cagao, que e um histograma dos valores reais 
e previstos da variavel de saida. Esse diagrama 
serve para avaliar o ajuste do modelo aos da¬ 
dos observados. E tambem possivel fazer uma 
lista de residuos por caso (casewise)tanto para 
casos em que o resfduo padronizado e maior 
do que dois desvios padroes (esse valor pode 
ser alterado, mas o padrao e razoavel) quanto 
para todos os casos. Recomendo um exame 
mais detalhado dos residuos, mas essa opgao 
pode ser util para uma inspecao rapida. Voce 
pode solicitar ao SPSS que apresente um in- 
tervalo de confianga (veja a Segao 1.6.2) para 
a estatistica exp b; o SPSS versao 12 apre- 
senta um intervalo de confianga de 95% que 
e apropriado e, tambem, uma estatistica util 
para se ter. Mais importante ainda, voce pode 
solicitar a estatistica de aderencia de Hosmer- 
Lemeshow, que pode ser utilizada para avaliar 
quao bem o modelo escolhido se ajusta aos 
dados. As opcdes restantes nao sao importan- 
tes: voce pode escolher apresentar todas as es- 
tatisticas e graficos a cada estagio de uma ana¬ 
lise (o padrao) ou somente ao final, quando o 
modelo estiver determinado. Finalmente, voce 
pode obter a matriz dos coeficientes das esti- 
mativas dos parametros em termos do modelo, 
coeficientes e valores de verossimilhanga-log 


a cada iteragao do processo de estimagao dos 
parametros - a praticidade disso e desperdiga- 
da pela maioria das pessoas! 

6.5 INTERPRETANDO A REGRESSAO 
LOGISTICA © 

Quando voce tiver selecionado todas as 
opgoes, clique em ~° K ~ e observe a saida apare- 
cer na janela do visualizador. Explicarei cada 
parte da saida mais adiante. Em versoes ante- 
riores do SPSS, a saida da regressao logistica 
nao era formatada (ela aparecia apenas como 
texto - veja a primeira edigao deste livro se 
voce estiver curioso!), mas atualmente a saida 
aparece formatada em belas tabelas! 

6.5.1 0 modelo inicial © 

A Saida do SPSS 6.1 nos informa sobre 
os codigos do parametro atribuidos a variavel 
categorica previsora. Codigos indicadores fo- 
ram escolhidos com duas categorias e, assim, 
o codigo e o mesmo dos valores no editor de 
dados. Se o codigo do desvio for escolhido, 
ele sera — 1 (fb Sim) e 1 (fb Nao). Com o 
contraste simples, os codigos serao —0,5 (fb 
Nao) e 0,5 (fb Sim) se a ultima categoria for 
selecionada como referenda. Os codigos do 
parametro sao importantes para calcular a 
probabilidade da variavel de saida (P(Y)), mas 
voltaremos a isso mais tarde. 


Saida do SPSS 6.1 

Dependent Variable Encoding 
(Codificagao da variavel dependente) 


Original Value 
(Valor Original) 

Internal Value 
(Valor Interno) 

No (Nao) 

Yes (Sim) 

0 

1 


Categorical Variable Codings (Codigos da variavel categorica) 




Frequency 

Parameter (Parametro) 



m 

(Frequencia) 

False Belief Understanding (En- 

Yes (Sim) 

29 

0.000 

tendimento de falsas crengas) 

No (Nao) 

41 

1.000 
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Para a primeira analise, requisitamos o 
metodo passo a passo para frente (forward 
stepwise ), portanto, o modelo inicial e deter- 
minado utilizando somente a constante na 
equagao de regressao. A Saida 6.2 do SPSS 
nos informa sobre o modelo quando somente 
a constante e incluida (isto e, todas as variaveis 
previsoras sao omitidas). Embora o SPSS nao 
apresente esse valor, a verossimilhan^a-log 
do modelo base (veja a Segao 6.3.1) e 96,124 
(acredite em mim por enquanto!). Isso repre- 
senta o valor da aderencia quando o modelo 
mais basico e ajustado aos dados. Quando in- 
clui somente a constante, o computador cria 
um modelo que atribui todos os participantes a 
uma unica categoria da variavel de safda. Nesse 
exemplo, o SPSS pode decidir tanto prever que 
cada crianga tern um entendimento das regras 


de comportamento ou prever que cada crianca 
nao tern entendimento das regras de comporta¬ 
mento. Ele pode tomar essa decisao arbitraria- 
mente, mas porque e crucial maximizar quao 
bem o modelo preve os valores observados, 
o SPSS ira prever que todas as criangas per- 
tencem a categoria onde a maioria dos dados 
estaria. Nesse exemplo, 39 criancas tern um 
entendimento das regras de comportamento e 
somente 31 nao. Dessa forma, se o SPSS preve 
que todas as criancas tern um entendimento das 
regras de comportamento, essa previsao estara 
correta 39 vezes em 70 (isto e, 56% aproxima- 
damente). Contudo, se o SPSS preve que cada 
crianca nao apresenta entendimento das regras 
de comportamento, a previsao estara correta 31 
vezes em 70 (44% aproximadamente). Assim, 
das duas opgoes, e melhor prever que todas as 


Saida do SPSS 6.2 

Classificagao Table 3, b (Tabela de classificacao) 


Observed (Observado) 

Predicted (Previstos) 

Display Rule Understanding 
(Entendimento das Regras 
de Comportamento) 

Percentage 

Correct 

(Percentual 

Correto) 

No (Nao) 

Yes (Sim) 

Step 0 

Display Rule Understanding 

No (Nao) 

0 

31 

0.0 

(Passo 0) 

(Entendimento das Regras de 






Comportamento) 






Overall Percentage (Estatfsticas 

Yes (Sim) 

0 

39 

100.0 


Gerais) 




55.7 


a A constante esta incluida no modelo. 
b 0 valor de corte e 0,500. 


Variables in the Equation (Variaveis na equagao) 




B 

S.E. 

(Erro Padrao) 

Wald 

df (gl) 

Sig. (Sig.) 

Exp(B) 

Step 0 
(Passo 0) 

Constant 

(Constante) 

0.230 

0.241 

0.910 

1 

0.340 

1.258 


Variables not in the Equation (Variaveis que nao estao na equagao) 




Score (Escore) 

df (gl) 

Sig. (Sig.) 

Step 0 

Variables (Variaveis) 

AGE (Idade) 

15.956 

1 

0.000 

(Passo 0) 


FB(1) 

24.617 

1 

0.000 



AGE by FB(1) 

23.987 

1 

0.000 


Overall Statistics (Estatfsticas 
Gerais) 


26.257 

3 

0.000 
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criangas apresentam entendimento das regras 
de comportamento porque isso resulta em um 
numero maior de previsoes corretas. A safda do 
SPSS mostra uma tabela de contingencia para 
o modelo em seu estado basico. O SPSS previu 
que todas as criangas tem entendimento das 
regras de comportamento, o que resulta numa 
acuracia de 0 % para as criangas observadas 
como nao tendo entendimento das regras de 
comportamento, e 100 % para as que passaram 
no teste da tarefa das regras de comportamen¬ 
to. No todo, o modelo classifica corretamente 
55,71% das criangas. A proxima parte da safda 
resume o modelo, e isso requer citar o valor da 
constante ( b 0 ), que e igual a 0,23. 

A tabela final da safda e denominada Va¬ 
riaveis que nao estao na Equagao (Variables 
not in the Equation). A ultima linha dessa ta¬ 
bela apresenta a estatistica qui-quadrado dos 
resfduos como 26,257, que e significativa a p 
< 0,0001 (ela e chamada de estatistica global 
- Overall Statistics). Essa estatistica informa 
que os coeficientes para as variaveis que nao 
estao no modelo sao significativamente dife- 
rentes de zero; em outras palavras, que a adi- 
gao de uma ou mais dessas variaveis ao mode¬ 
lo ira afetar significativamente o seu poder de 
previsao. Se a probabilidade para o qui-qua- 
drado residual fosse maior do que 0,05, isso 
implicaria que nenhuma das variaveis excluf- 
das do modelo contribuiria de forma significa¬ 
tiva para o poder preditivo do modelo. Desse 
modo, a analise terminaria nesse estagio. 

O restante dessa tabela lista cada um dos 
previsores com o valor da estatistica do escore 
eficiente de Roa para cada uma (coluna deno¬ 
minada Escore [Score]). Em amostras grandes, 
quando a hipotese nula e verdadeira, a estatfs- 
tica escore e identica a estatistica de Wald e 
a estatistica da razao de verossimilhanca. Ela 
e utilizada nesse estagio da analise porque e 
computacionalmente menos intensiva que a 
estatistica de Wald e, assim, pode ser calcula- 
da em situagoes em que esta seria proibitiva. 
Como qualquer estatistica teste, a estatistica 
escore de Roa tem uma distribuigao especffica 
a partir da qual a sua significancia pode ser de- 
terminada. Nesse exemplo, todas as variaveis 


exclufdas tem estatfsticas escore significativas 
a p < 0,001 e, dessa forma, todas podem poten- 
cialmente contribuir para o modelo. Contudo, 
como mencionado na Secao 6.4.2, os calculos 
passo a passo sao relativos, portanto, a varia- 
vel que sera selecionada para inclusao e a que 
apresentar o maior valor para a estatistica esco¬ 
re e que seja significante ao nfvel de 0,05. Nes¬ 
se exemplo, tal variavel e a fb porque ela apre¬ 
senta a estatistica escore de valor mais alto. A 
proxima parte da safda lida com o modelo apos 
os previsores terem sido adicionados. 

6.5.2 Passo 1: Entendendo falsas 
crengas ® 

No primeiro passo, o entendimento de fal¬ 
sas crengas (fb) e adicionado ao modelo como 
um previsor. Assim, uma crianga e classifica- 
da como tendo um entendimento das regras de 
comportamento com base no sucesso ou nao 
no teste da tarefa das falsas ere 119 as. Agora, 
isso pode ser facilmente explicado se olhar- 
mos a tabulagao cruzada para as variaveis fb 
e display . 1 O modelo utilizara o entendimento 
de falsas crengas para prever se uma crianga 
compreende as regras de comportamento apli- 
cando a tabela de tabula^o cruzada mostrada 
na Tabela 6.1. Desse modo, o modelo preve 
que todas as crianqas que mostraram enten- 
der falsas crencas apresentarao compreensao 
das regras de comportamento. Existem 41 
crian^as com entendimento de falsas crencas, 
assim, o modelo preve que 41 crianqas tem 
entendimento das regras de comportamento 
(ele estara correto 33 vezes em 41 e incorreto 
8 vezes em 41). Alem disso, esse novo modelo 
preve que todas as 29 criancas que nao apre- 
sentaram entendimento de falsas crencas nao 
apresentam entendimento das regras de com¬ 
portamento (nessa situaqao, ele estara correto 
23 vezes em 29 e errado 6 vezes em 29). 

A Safda 6.3 do SPSS mostra um resumo 
das estatfsticas sobre o novo modelo (que, 


1 A caixa de dialogo para produzir essa tabela pode ser 
obtida acionando os menus Analyze=>Descriptive 
Statistics=>Crosstabs (Analisar=>Estati'stica Descri- 
tiva=>Tabulai;ao cruzada). 
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Table 6.1 Tabulagao cruzada das regras de comportamento com o 
entendimento de falsas crengas 




False Belief Undestanding (Fb) 
(Entendimento de Falsas Crengas) 



No (Nao) 

Yes (Sim) 

Display Rule (Regra de 
Comportamento) 

No 

(Nao) 

23 

8 

Understanding (display) 
(Entendimento) 

Yes 

(Sim) 

6 

33 


Saida do SPSS 6.3 


Omnibus Tests of Model Coeficientes 
(Testes em etapas dos coeficientes do modelo) 



Chi-square 

(Qui-quadrado) 

df (gl) 

Sig. (Sig.) 

Step (Passo 1) Step (Passo) 

26.083 

1 

0.000 

Block (Bloco) 

26.083 

1 

0.000 

Model (Modelo) 

26.083 

1 

0.000 


Model Summary (Resumo do Modelo) 


-2 Log likelihood 

Step (-2 Verossimilhanga-log) 

Cox Et Snell 

R Square 
(R quadrado de 

Cox e Snell) 

Nagelkerke R Square 
(R quadrado de 
Nagelkerke.) 

1 70.042 

0.311 

0.417 


Classification Table a (Tabela de Classificagao) 


Observed (Observado) 

Predicted (Previstos) 

Display Rule Understanding 
(Entendimento das Regras 
de Comportamento) 

Percentage 

Correct 

(Percentual 

Correto) 

No (Nao) 

Yes (Sim) 

Step 1 Display Rule Understanding (Entendi- No (Nao) 

23 

8 

74.2 

(Passo 1) mento das Regras de Comportamento) Yes (Sim) 

6 

33 

84.6 

Overall Percentage (Estatisticas Gerais) 



80.0 


a O valor de corte e 0,500. 


como ja vimos, contem fb). A aderencia glo¬ 
bal do novo modelo e determinada utilizando 
a estatfstica de verossimilhanga-log (veja a Se- 
gao 6.3.1). No SPSS, em vez de relatar o valor 
da verossimilhanga-log, o valor e multiplicado 
por — 2 (e algumas vezes denominado — 2VL 
( —2VL )): essa multi pi icagao e feita porque 
—2VL tern uma distribuigao aproximadamen- 
te qui-quadrado e, dessa forma, e possfvel 


comparar os seus valores contra aqueles que 
esperarfamos que fossem obtidos apenas por 
acaso. Lembre-se de que valores grandes da 
estatfstica VL indicam um modelo com uma 
ma aderencia. 

Nesse estagio da analise, o valor de —2x 
verossimilhanga-log deve ser menor do que 
quando somente a constante foi inclufda no 
modelo (porque valores baixos de —2VL in- 
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dicam que o modelo esta prevendo a variavel 
de saida com maior precisao). Quando somente 
a constante foi incluida, —2VL = 96,124, mas 
com a adigao da variavel fb, esse valor foi re- 
duzido para 70,042. Essa redugao nos informa 
que o modelo agora e melhor para prever o en- 
tendimento das regras de comportamento do 
que antes da variavel fb ter sido acrescentada. 
Voce pode determinar quao bem um modelo 
preve a variavel de saida utilizando a estatisti- 
ca do modelo qui-quadrado (model chi-square 
statistic), que avalia a diferenga entre o modelo 
atual e o modelo quando somente a constante 
esta incluida. Vimos na Segao 6.3.1 que pode- 
mos determinar a significancia da mudanga em 
um modelo tomando a verossimilhanga-log do 
novo modelo e subtraindo da verossimilhanga- 
log do modelo base. A estatistica do modelo 
qui-quadrado funciona com base nessa ideia 
e, dessa forma, e igual a —2VL com a varia¬ 
vel fb incluida menos o valor de —2VL quando 
somente a constante esta presente no modelo 
(96,124 - 70,042 = 26,083). Esse valor tern 
uma distribuigao qui-quadrado, portanto, sua 
significancia estatistica pode ser facilmente cal- 
culada. 2 Nesse exemplo, o valor e significativo 
ao nivel de 0,05, assim, podemos dizer que o 
modelo como um todo esta prevendo o entendi- 
mento das regras de comportamento melhor do 
que quando tinha apenas a constante. A estatis¬ 
tica do modelo qui-quadrado e analoga ao teste 
F para a soma dos quadrados da regressao linear 
(veja o Capitulo 5). O ideal seria ter um —2VL 
nao-significativo (indicando que a quantidade 
de dados nao explicados e minima) e uma esta¬ 
tistica do modelo qui-quadrado alta (indicando 
que o modelo incluindo os previsores e signifi- 
cativamente melhor do que sem os previsores). 
Contudo, na realidade e possivel que ambas as 
estatisticas sejam muito significativas. 

Existe uma segunda estatistica denominada 
estatistica passo (step), que indica a melhoria 
no poder preditivo do modelo a partir do ultimo 


2 Os graus de liberdade serao o numero de parametros 
no novo modelo (o numero de previsores mais 1; nesse 
caso, com um previsor, e 2) menos o numero de para¬ 
metros no modelo base (que e 1, a constante). Portanto, 
nesse caso, gl = 2—1 = 1. 


estagio. Nesse estagio existiu apenas um passo 
na analise, portanto, o valor da estatistica de 
melhoria e a mesmo do qui-quadrado do mode¬ 
lo. Contudo, em modelos mais complexos em 
que existem tres ou quatro estagios, esta estatis¬ 
tica fornece uma medida da melhoria do poder 
preditivo do modelo desde o ultimo passo. Seu 
valor e igual ao —2VL no passo atual menos o 
—2VL no passo anterior. Se a estatistica de me¬ 
lhoria e significativa, ela indica que o modelo 
agora preve a saida significativamente melhor 
do que no ultimo passo, e numa regressao para 
frente (forward ), isso pode ser entendido como 
uma indicagao da contribuigao de um previsor 
para o poder preditivo do modelo. De forma se- 
melhante, a estatistica bloco (block) fornece a 
mudanga no —2VL desde o ultimo bloco (para 
uso em analises hierarquicas ou por blocos). 

Finalmente, a tabela de classificagao no 
final da segao de saida indica quao bem o mo¬ 
delo preve a inclusao em um grupo. Em virtu- 
de de o modelo estar utilizando o entendimen- 
to de falsas crengas para prever a variavel de 
saida, essa tabela de classificagao e a mesma 
que a Tabela 6.1. O modelo atual classifica 
corretamente 23 criangas que nao apresentam 
compreensao das regras de comportamento, 
mas classifica errado outras 8 (isto e, ela clas¬ 
sifica corretamente 74,19% dos casos). Para 
as criangas que tern compreensao das regras 
de comportamento, o modelo classifica corre¬ 
tamente 33 e erra em 6 casos (isto e, ele clas¬ 
sifica 84,62% dos casos corretamente). A acu- 
racia global de classificagao e, dessa forma, a 
media ponderada desses dois valores (80%). 
Assim, quando somente a constante foi in¬ 
cluida o modelo classificou corretamente 56% 
das criangas, mas com a inclusao do previsor 
fb, esse valor subiu para 80%. 

A proxima parte da saida (Saida do SPSS 
6.4) e crucial porque ela nos informa as estima- 
tivas dos coeficientes dos previsores incluidos 
no modelo. Essa segao da saida nos fornece os 
coeficientes e estatisticas para as variaveis que 
foram incluidas no modelo nesse ponto (a saber, 
a constante e a fb). O valor be'o mesmo valor 
da regressao linear: eles sao os valores que pre- 
cisamos para substituir na equagao (6.4) a fim 
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Saida do SPSS 6.4 

Variables in the Equation (Variaveis na equagao) 



B 

S.E. 

(Erro 

Padrao) 

Wald 

df 

(gl) 

Sig. 

(Sig.) 

Exp(B) 

95,0% C.l for EXP(B) 

(I.C de 95% para EXP(B)) 

Lower 

(Inferior) 

Upper 

(Superior) 

Step 

FB(1) 

2.761 

0.605 

20.856 

1 

0.000 

15.812 

4.835 

51.706 

(Passo) 










r 

Constant 

-1.344 

0.458 

8.592 

1 

0.003 

0.261 




(Constante) 










a Variable(s) entered on Step 1: FB (Variavel(is) adicionada(s) no passo 1: FB). 


de identificar a probabilidade de que um caso 
pertenga a uma determinada categoria. Vimos 
na regressao linear que o valor de b representa 
a modificagao na sai'da resultante da mudanga 
de uma unidade na variavel previsora. A inter- 
pretagao desse coeficiente na regressao logfs- 
tica e muito semelhante no sentido de que ele 
representa a chance na logit da variavel de safda 
associada a alteragao de uma unidade na varia¬ 
vel previsora. A logit da safda e simplesmente o 
logaritmo natural da chance de Y ocorrer. 

Uma estatfstica importante e a estatfstica de 
Wald, 3 que tern uma distribuigao qui-quadrado e 
nos informa se o coeficiente b para o dado pre¬ 
visor difere de zero de forma significativa. Se 
isso acontece, podemos assumir que o previsor 
esta contribuindo de modo significativo para a 
previsao da safda (Y). Vimos, na Segao 6.3.3, 
que a estatfstica de Wald deve ser utilizada com 
cautela porque, quando o coeficiente da regres¬ 
sao (b) e grande, o erro padrao tende a ficar in- 
flacionado, resultando em uma subestimativa da 
estatfstica (veja Menard, 1995). Contudo, em 
relagao a esses dados ela parece indicar que a 
compreensao das falsas crengas e um previsor 
significativo para o entendimento das regras de 
comportamento (observe que a significancia da 
estatfstica de Wald e menor do que 0,05). 

Na Segao 6.3.2, vimos que podfamos 
calcular um valor analogo de R utilizando a 
equagao (6.7). Para esses dados, a estatfstica 


3 0 SPSS na realidade apresenta a estatfstica de 
Wald ao quadrado, assim, para esses dados ela seria 
(2,761/0,605) 2 = 20,8, como o apresentado na tabela - 
ver equagao (6.11). 


de Wald e seus gl podem ser vistos na Safda 
do SPSS 6.4 (20,856 e 1, respectivamente) e o 
valor original do —2VL e 96,12. Dessa forma, 
R pode ser calculado como: 


Rm 120’856 —(2x1)\ 

VI 96,124 / 

= 0,4429 


(6.14) 


Na mesma segao, vimos que a medida de 
Hosmer e Lemeshow (R 2 ) e calculada dividin- 
do o qui-quadrado do modelo pelo valor origi¬ 
nal de —2VL. Nesse exemplo, o qui-quadrado 
do modelo apos todas as variaveis terem 
sido adicionadas e 26,083 e o valor original 
de — 2VL (antes que qualquer variavel tenha 
sido adicionada) foi 96,124. Assim, Ry = 
26,083/96,124 = 0,271, que e diferente do 
valor que seria obtido pela elevagao ao qua¬ 
drado do R determinado acima (R 2 = 0,4429’ 
= 0,196). Na Safda 6.3 do SPSSS, foram for- 
necidas duas outras medidas de R 2 , descritas 
na Segao 6.3.2. A primeira delas e a medida de 
Cox e Snell, 4 que o SPSS fornece como 0,311, 


4 Ela e calculada a partir da equagao (6.9). Lembre-se de 
que essa equagao utiliza a verossimilhanga-log e que 
o SPSS apresenta como —2 x verossimilhanga-log. 
VL(Nova) e, dessa forma, 70.042/-2 = —35,021 e a 
VL(Base) = 96,124/—2 — —48,062. O tamanho n da 
amostra e 70. Portanto: 

, {—2_[—35,021—(—48,062)]) 

Rc S = l—e 1 * 1 

— 1 — g—0,3726 

= 1-0,6889 

= 0,311 
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e a segunda e o valor ajustado de Negelkerke, 5 
que o SPSS calcula como sendo 0,417. Como 
voce pode ver, existe uma diferenga substan- 
cial entre os dois valores! 

O ultimo item que precisamos analisar e a 
exp b (Exp(B)) na safda do SPSS, que foi des- 
crita na Segao 6.3.4. Para calcular a mudanga 
nas chances que resultam da variagao de uma 
unidade no previsor, neste exemplo, preci¬ 
samos primeiro calcular as chances de uma 
crianga entender as regras de comportamento 
dado que ela nao tern uma compreensao de se¬ 
gunda ordem de falsas crengas. Depois calcu- 
lamos as chances de uma crianga ter entendi- 
mento das regras de comportamento dado que 
ela compreende falsas crengas. Finalmente, 
calculamos a mudanga proporcional nessas 
duas chances. 

Para calcular o primeiro conjunto de chan¬ 
ces, precisamos utilizar a equagao (6.12) a fim 
de calcular a probabilidade de uma crianga 
compreender regras de comportamento visto 
que ela falhou na tarefa das falsas crengas. O 
codigo do parametro no inicio da safda indi- 
ca que a uma crianga que falhou na tarefa de 
falsas crengas foi atribufdo o codigo 0; dessa 
forma, podemos utilizar esse valor no lugar de 
X. Estimamos o valor de b 1 como 2,7607 (veja 
Variaveis na Equagao na Safda 6.4 do SPSS) e 
a constante, que pode ser obtida na mesma ta- 
bela, e —1,3437. Podemos calcular as chances 
como na equagao (6.15): 


5 Ela e calculada a partir da equagao (6.10) - existe uma 
pequena diferenqa porque eu utilizei valores arredon- 
dados na terceira decimal: 


/ J ( Even to Y) = 


1 


l ^-(^o+h-Xi) 

1 


2 _|_ e -[-l,3437+(2,7607x0)] 

= 0,2069 


Nao 
Evento Y 


h 


1 - 


Chance 


P(Evento Y) 

= 1-0,2069 
= 0,7931 
_ 0,2069 

~~ 0,7931 
= 0,2609 


(6.15) 


Em seguida, fazemos o mesmo calculo 
apos a variavel previsora ter mudado em uma 
unidade. Nesse caso, em virtude do previsor 
ser dicotomico, precisamos calcular as chan¬ 
ces de uma crianga que passou na tarefa de 
entendimento das regras de comportamento, 
dado que ela tinha passado na tarefa das falsas 
crengas. Assim, o valor da variavel falsas cren¬ 
gas, X, agora e 1 (em vez de 0). Os calculos 
resultantes sao mostrados na equagao (6.16): 


P(EventoE) = 

1 

_ i I -[-l,3437+(2,7607xl)] 

= 0,8049 


^(evciho r) = * - AEvento I") 
= 1-0,8049 
= 0,1951 


Chance 


0,8049 

0,1951 

4,1256 


(6.16) 


/?v = - 


0,311 


f “t *ro,' 

l — e ™ 

0,311 


0,311 

~ 1-0,2533 
= 0,416 


Sabemos as chances antes e depois da al- 
teragao de uma unidade na variavel previsora. 
Agora, basta calcular a mudanga proporcional 
em chances dividindo a chance apos a mudan¬ 
ga de uma unidade no previsor pela chance 
antes da mudanga: 
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Chance apos a 
mudanga de uma 

.unidade no previsor ., , 

AChance =-- (6.17) 

chance original 

_ 4,1256 

0,2609 
= 15,8129 

Voce deve notar que o valor da mudanga 
proporcional em chances e a mesma que o 
SPSS apresenta para o valor exp b (exceto por 
uma diferenga no arredondamento). Podemos 
interpretar exp b em termos de uma mudan¬ 
ga nas chances. Se o valor e maior do que 1, 
entao ele indica que a medida que o previsor 
aumenta, aumentam as chances de uma saida 
ocorrer. Ja um valor menor do que 1 indica que 
a medida que o previsor aumenta, as chances 
de uma saida ocorrer diminuem. Nesse exem- 
plo, podemos afirmar que as chances de uma 
crianga que compreende falsas crengas enten- 
der tambem as regras de comportamento e 15 
vezes maior do que uma crianga que nao com¬ 
preende falsas crengas. 

Nas opgoes (veja a Segao 6.4.5), requisi- 
tamos um intervalo de confianga para o exp b 
e ele tambem pode ser visto na saida. Interpre- 
tamos um intervalo de confianga da seguinte 
maneira: se executassemos 100 experimentos 
e calculassemos os intervalos de confianga 
para o valor exp b, esses intervalos conteriam 


o valor populacional de exp b em 95 ocasioes. 
Assim, nesse caso, poderfamos estar razoavel- 
mente confiantes de que o valor populacional 
de exp b ficaria entre 4,84 e 51,71. Contudo, 
existiria uma probabilidade de 5% de que uma 
amostra forneceria um intervalo de confianga 
que nao conteria o valor real de exp b. 

A estatistica teste para fb se ela for remo- 
vida do modelo esta na Saida 6.5 do SPSS. 
Em um momento anterior, falei que a regres- 
sao coloca as variaveis na equagao e entao 
testa se elas atendem ao criterio de remogao. 
Bern, (modelo se o termo e removido) nos in¬ 
forma os efeitos da remogao. O importante a 
observar e a significancia da razao da verossi- 
milhanga-log (VR log). O VR Log para esse 
modelo e altamente significativo (p < 0,0001), 
o que indica que se removermos fb do mo¬ 
delo, teremos um efeito significativo na sua 
habilidade preditiva - em outras palavras, nao 
seria uma boa ideia remove-la! 

Finalmente, somos informados sobre as 
variaveis que nao estao atualmente no mode¬ 
lo. Primeiro, o qui-quadrado residual (deno- 
minado Estatistica Global - Overall Statistics 
- na saida), que nao e significativo, informa 
que nenhuma das variaveis restantes apresenta 
coeficientes significativamente diferentes de 
zero. Alem disso, cada variavel e listada com 
sua estatistica escore e o valor da significan¬ 
cia e para as duas variaveis os coeficientes 
nao sao significativamente diferentes de zero 


Saida do SPSS 6.5 

Mode! if Term Removed (Modelo se o Termo e Removido) 



Model LogLikelihood 
(Verossimilhanga-Log do Modelo) 

Change in -2logLikelihood. 
(Mudanga no -2xVerossimilhanga-Log) 

df 

(gi) 

Sig. of Change 
(Sig. da Mudanga) 

Step 1 FB 

(Passo 1) 

-48.062 

26.083 

1 

0.000 


Variables not in the Equation (Variaveis que nao estao na equagao) 



Score (Escore) 

df 

(gi) 

Sig. (Sig.) 

Step 1 Variables (Variaveis) AGE (idade) 

2.313 

1 

0.128 

(Passo 1) 




AGE by FB(1) (Idade por FB(1)) 

1.261 

1 

0.261 

Overall Statistics 

2.521 

2 

0.283 

(Estatisticas Gerais) 
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(como pode ser visto pelos valores da signi¬ 
ficance de 0,128 para a idade e 0,261 para a 
interaqao da idade com o entendimento de fal- 
sas crencas). Portanto, nenhuma variavel nova 
sera adicionada a equacao. 

A proxima parte da salda (Saida 6.6 do 
SPSS) mostra um diagrama de classif'icaqao 
que requisitamos na caixa de dialogo opqoes 
(options). O diagrama e um histograma das 
probabilidades previstas de uma crianca pas- 
sar na tarefa da regra de comportamento. Se 
o modelo adere perfeitamente aos dados, o 
histograma deve mostrar todos os casos em 
que o evento ocorreu no lado direito e todos 
os casos em que o evento nao ocorreu no lado 
esquerdo. Em outras palavras, as criancas que 
passaram na tarefa da regra de comportamen¬ 
to devem aparecer na direita e aquelas que 


falharam devem aparecer na esquerda. Nesse 
exemplo, o unico previsor significativo e di- 
cotomico e, assim, existem apenas duas colu- 
nas de casos no diagrama. Se o previsor fosse 
uma variavel contfnua, os casos estariam es- 
palhados por muitas colunas. Como uma regra 
pratica, quanto mais os casos se concentrarem 
nos finais do grafico, melhor. Essa afirma- 
qao e verdadeira porque tal grafico mostrara 
que quando a salda de fato ocorre (isto e, a 
crianca entende as regras de comportamento) 
a probabilidade prevista de um evento ocorrer 
tambem e alta (isto e, proximo de 1). Da mes- 
ma forma, na outra ponta o diagrama mos¬ 
trara que quando o evento nao ocorre (isto e, 
quando a crianca falha em entender as regras 
de comportamento), a probabilidade prevista 
da ocorrencia do evento e baixa (proxima de 


Saida do SPSS 6.6 


Observed Groups and Predicted Probabilities (Grupos observados e 
probabilidades previstas) 


80 


F 

F R 
R E 
E Q 
Q U 
U E 
E N 
N C 
C I 
Y A 
S 


60 


40 


20 


Y 

N 

N 

N 

N 

N 


Y 

Y 

Y 

Y 

Y 

Y 
N 
N 


Predicted -|-|- 

(Previstos) 

Prob: 0 0.25 0.5 0.75 1 

Groups:NNNNNNNNNNNNNNNNNNN^ 

(Grupos) 

Predicted Probability is of Merbership for Yes (Probabilidades 
previstas sao de inclusao no grupo Sim) 

Symbols: N - No, 

Y - Yes (Simbolos: N - Nao, Y — Sim) 

Each Symbol Represents 5 Cases (Cada simbolo representa 5 casos) 
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f -|- 

Dica da Samanta Ferrinho 





V. 


• A aderencia global do modelo e mostrada pela estatlstica -2x verossimilhan- 
ga-log e a estatlstica qui-quadrado associada. Se a significance do qui-qua- 
drado e menor do que 0,05, entao o modelo se ajusta de forma significativa 
aos dados. 

• Verifique a tabela denominada "Variaveis na equagao" a fim de ver quais varia- 
veis sao significativas para prever a salda. 

• Para cada variavel no modelo, verifique a estatlstica de Wald e sua significan¬ 
cia (que deve ser menor que 0,05). Mais importante, utilize o valor do Exp(B) 
para a interpretagao. Se o valor for maior do que 1, entao quando o previsor 
aumenta, as chances de uma salda ocorrer aumentam. Ja um valor menor 
do que 1 indica que quando o previsor aumenta, as chances de uma salda 
ocorrer diminuem. Para a interpretagao acima mencionada ser confiavel, o 
intervalo de confianga de Exp(B) nao deve ultrapassar 1! 

• Confira a tabela denominada "Variaveis que nao estao na equagao" para ver 
quais variaveis nao preveem de forma significativa a saida. 


zero). Essa situagao representa um modelo 
que esta prevendo corretamente os dados de 
saida. Se, contudo, existirem muitos pontos 
agrupados no centra do diagrama, isso mostra 
que em muitos casos o modelo esta prevendo 
uma probabilidade de ocorrencia do evento de 
0,50. Em outras palavras, para esses casos nao 
existe mais do que uma chance de 50:50 de 
que o dado sera previsto corretamente; o mo¬ 
delo pode prever esses casos tao bem quanto 
o lancamcnto de uma moeda (jogar cara ou 
coroa) o faria. Ainda, um bom modelo ira as- 
segurar que poucos casos sejam mal classifi- 
cados; nesse exemplo existem dois Ns no lado 
direito do modelo e um Y no lado esquerdo 
do modelo. Esses sao casos mal classificados; 
quanto menos desses existirem, melhor sera 
o modelo. 

6.5.3 Listando probabilidades previstas © 

E possivel listar as probabilidades espe- 
radas da variavel de saida que ocorrem com 
base no modelo final. Na Segao 6.4.4, vimos 
que o SPSS pode salvar os residuos e tambem 
as probabilidades previstas. O SPSS salva 
essas probabilidades e a previsao de perti- 
nencia a um grupo como variaveis no editor 
de dados com os nomes PRE_1 e PGR_1, 
respectivamente. Essas probabilidades po- 


dem ser listadas utilizando a caixa de dialogo 
AnalyzesRe]iorts=>Case Summaries... 
(Analisar^Relatar^Resumo de Casos...) 
(veja a Segao 5.8.6). A Saida do SPSS 6.7 
mostra uma selegao das probabilidades pre¬ 
vistas (porque o unico previsor significativo 
e uma variavel dicotomica, existirao somen- 
te dois valores de probabilidades previstas). 
Tambem vale a pena listar as variaveis pre- 
visoras como meio de esclarecer de onde as 
probabilidades previstas surgem. 

Vimos, a partir do modelo, que o unico 
previsor significativo da compreensao das re- 
gras de comportamento foi o entendimento das 
falsas crengas. Ele pode ter um valor tanto de 1 
(passar na tarefa das falsas crengas) quanto de 
0 (falhar na tarefa das falsas crengas). Se esses 
dois valores sao colocados na equagao (6.4) 
com os respectivos coeficientes de regressao, 
os dois valores das probabilidades sao obtidos. 
De fato, calculamos esses valores como parte 
da equagao (6.15) e da equagao (6.16), e voce 
deve ter observado que as probabilidades cal- 
culadas correspondent aos valores em PRE_1. 
Esses valores nos informam que quando uma 
crianga nao possui o entendimento de segunda 
ordem das falsas crengas (fb = 0, Nao), exis¬ 
te uma probabilidade de 0,2069 de que ela 
passe na tarefa da compreensao das regras de 
comportamento - aproximadamente 21% de 
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Saida do SPSS 6.7 


Case Summaries a (Resumo dos casos) 



Case 
Number 
(Numero 
do Caso) 

Age in years 
(Idade em 
anos) 

False Belief 
Understanding 
(Entendimento 
de Falsas 
Crengas) 

Display Rule 
Understanding 
(Entendimento 
das Regras de 
Comportamento) 

Predicted 

probability 

(Probabilidade 

prevista) 

Predicted 

group 

(Grupo previsto) 

1 

i 

24.00 

Nao 

Nao 

0.20690 

Nao 

2 

5 

36.00 

Nao 

Nao 

0.20690 

Nao 

3 

9 

34.00 

Nao 

Sim 

0.20690 

Nao 

4 

10 

31.00 

Nao 

Nao 

0.20690 

Nao 

5 

11 

32.00 

Nao 

Nao 

0.20690 

Nao 

6 

12 

30.00 

Sim 

Sim 

0.80488 

Sim 

7 

20 

26.00 

Nao 

Nao 

0.20690 

Nao 

8 

21 

29.00 

Nao 

Nao 

0.20690 

Nao 

9 

29 

45.00 

Sim 

Sim 

0.80488 

Sim 

10 

31 

41.00 

Nao 

Sim 

0.20690 

Nao 

11 

32 

32.00 

Nao 

Nao 

0.20690 

Nao 

12 

43 

56.00 

Sim 

Sim 

0.80488 

Sim 

13 

60 

63.00 

Nao 

Sim 

0.20690 

Nao 

14 

66 

79.00 

Sim 

Sim 

0.80488 

Sim 

Total N 


14 

14 

14 

14 

14 


a Limitado aos primeiros 100 casos. 


chance (1 em 5 criangas). Contudo, se a crian- 
ga passa na tarefa das falsas crengas (fb = 1, 
Sim), existe uma probabilidade de 0,8049 de 
que ela ira passar na regra de comportamento 
- uma chance de 80,5% (4 em cada 5 crian¬ 
gas). Uma probabilidade de 0 indica que uma 
crianga nao tern chance de passar na tarefa do 
entendimento das regras de comportamento, e 
uma probabilidade de 1 indica que a crianga 
ira definitivamente passar nessa regra. Por- 
tanto, os valores obtidos mostram a importan- 
cia do entendimento das falsas crengas como 
pre-requisito para entendimento das regras de 
comportamento. 

Assumindo que o modelo e preciso e que 
o entendimento das falsas crengas e significa¬ 
tive, podemos concluir que o entendimento 
das falsas crengas e o unico previsor do enten¬ 
dimento das regras de comportamento. Alem 
disso, a idade e a interagao da idade com o en¬ 
tendimento das falsas crengas nao preveem de 
maneira alguma o entendimento das regras de 
comportamento. Como exerefeio, tente refazer 
essa analise utilizando o metodo da entrada 
forgada. Quais as diferengas nas conclusdes? 

Para ter certeza de que o modelo, de fato, 
e bom, e importante examinar os residues. Na 


Segao 6.4.4, vimos como o SPSS salva os va- 
rios resfduos no editor de dados. Agora pode¬ 
mos listar esses resfduos utilizando a caixa de 
dialogo Analyzes Regorts=>Case Summa¬ 
ries... (Analisar=>Relatar=>Resumo de Ca¬ 
sos...) e interpreta-los. 

6.5.4 Interpretando os residuos © 

Os principais objetivos de examinar os 
resfduos na regressao logfstica sao (1) isolar 
pontos em que o modelo tem pouca aderencia 
e (2) isolar pontos que exercem uma influencia 
indevida no modelo. Para avaliar o primeiro, 
vamos examinar os resfduos, especialmente os 
estudentizados, os padronizados e as estatfsti- 
cas de desvio. Todas essas estatfsticas tem uma 
propriedade em comum: 95% dos casos em 
media, em uma amostra normalmente distribu- 
fda, devem ter valores que estao entre ±1,96, 
e 99% dos casos devem ter valores que estao 
entre ± 2,58. Dessa forma, qualquer valor fora 
do intervalo ±3 deve ser motivo de preocupa- 
gao e qualquer um fora do intervalo ±2,5 deve 
ser examinado com cuidado. Para avaliar a 
influencia de casos individuals, utilizamos as 
estatfsticas de influencia, como a distancia de 
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Cook (que e interpretada da mesma forma que 
na regressao linear: como uma medida da mu- 
danga no coeficiente de regressao se um caso 
e retirado do modelo). O valor do DFBeta, que 
e a versao padronizada da estatfstica de Cook, 
tambem nos informa sobre a influencia de cer- 
tos casos - qualquer valor maior do que 1 in- 
dica casos potencialmente influentes. Ainda, a 
estatfstica de influencia de valores chapeu, que 
devem estar entre 0 (o caso nao tem influencia 
alguma) a 1 (o caso exerce completa influencia 
sobre o modelo), nos informa se certos casos 
estao exercendo influencia indevida sobre o 
modelo. O valor esperado da influencia ( le¬ 
verage ) e definido como na regressao linear. 
Essas estatfsticas foram explicadas em mais 
detalhes no Capftulo 5. 

Se voce requisitou as estatfsticas residuais, 
o SPSS salva cada uma como uma nova colu- 
na no editor de dados; a Tabela 6.2 lista cada 
nome das variaveis e o que elas representam. 
Existem comentarios adicionais resumindo os 
valores esperados de algumas estatfsticas. 

A Safda do SPSS 6.8 mostra as estatfsticas 
residuais basicas para esse exemplo (distancia 
de Cook, influencia, resfduos padronizados 
e valores DFBeta). Note que todos os casos 


apresentam valores DFBetas menores do que 
lea estatfstica de influencia (LEV_1) proxi- 
ma ao valor calculado esperado de 0,03. Tam¬ 
bem nao existem valores anormalmente altos 
da distancia de Cook (COO_l), o que signifi- 
ca que nao existem casos influentes afetando 
o modelo. A distancia de Cook e uma medida 
nao-padronizada e, assim, nao existe um valor 
absoluto que nos permita afirmar que um caso 
esta tendo influencia. Em vez disso, voce deve 
olhar para valores da distancia de Cook que 
sao particularmente altos comparados com 
outros casos da amostra. Contudo, Stevens 
(1992) sugere que um valor maior do que 1 e 
problematico. Aproximadamente metade dos 
valores da influencia sao um tanto altos, mas 
como as outras estatfsticas estao bem, isso nao 
deve ser um motivo de preocupagao. 

Os resfduos padronizados tem valores 
menores do que ±2,5 e em geral apresentam 
valores menores do que ±2, portanto, parece 
nao haver motivos para se preocupar. 

Voce podera notar que esses resfduos nao 
sao usuais porque sao baseados em um unico 
previsor categorico. Esse e o motivo de nao 
existir muita variabilidade nos valores dos 
resfduos. Tambem, se valores atfpicos subs- 


Table 6.2 Resumo das estatisticas residuais salvas pelo SPSS 


Rotulo 

Nome 

Comentario 

PRE1 

Valor previsto 


PGR1 

Grupo previsto 


COOJ 

Distancia de Cook 

Deve ser menor do que 1 

LEVI 

Influencia ( Leverage) 

Deve estar entre 0 (sem influencia) e 1 (completa influen¬ 
cia). A influencia esperada e (k +1)/N, onde/r e o numero 
de previsores e N e o tamanho da amostra. Nesse caso, ela 
deve ser 2/70 = 0,03. 

RES_1 

Residuo 


LRE1 

Residuo Logit 


SRE_1 

Residuo Estudentizado 

5% podem estar alem ±1,96 e 1% alem ±2,58. 

ZRE1 

Residuo padronizado 

Casos acima de 3 sao motivos de alerta e casos proximos 
de 3 merecem uma investigagao. 

DEV_1 

Desvios 


DFB0_1 

DFBeta para a constante 

Deve ser menor do que 1. 

DEF1_1 

DFBeta para o primeiro 
previsor (fb) 
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Saida do SPSS 6.8 


Case Summaries a (Resumo dos casos) 



Case 
Number 
(Numero 
do Caso) 

Analog of Cook's 
influence statistics 
(Analogo da estatistica 
de influencia de Cook.) 

Leverage 
value (Valor 
da influencia) 

Normalized 

residual 

(Residuo 

normalizado) 

DFBeta for 

constant 
(DFBeta para 
a constante) 

DFBeta for 
FB(1) 

(DFBeta para 
aFB(l)) 

1 

i 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

2 

2 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

3 

3 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

4 

4 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

5 

5 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

6 

6 

0.13690 

0.03448 

1.95789 

0.17262 

-0.17262 

7 

7 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

8 

8 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

9 

9 

0.13690 

0.03448 

1.95789 

0.17262 

-0.17262 

10 

10 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

11 

11 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

12 

12 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

13 

13 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

14 

14 

0.10312 

0.02439 

-2.03101 

0.00000 

-0.12812 

15 

15 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

16 

16 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

17 

17 

0.13690 

0.03448 

1.95789 

0.17262 

-0.17262 

18 

18 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

19 

19 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

20 

20 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

21 

21 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

22 

22 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

23 

23 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

24 

24 

0.10312 

0.02439 

-2.03101 

0.00000 

-0.12812 

25 

25 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

26 

26 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

27 

27 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

28 

28 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

29 

29 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

30 

30 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

31 

31 

0.13690 

0.03448 

1.95789 

0.17262 

-0.17262 

32 

32 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

33 

33 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

34 

34 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

35 

35 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

36 

36 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

37 

37 

0.10312 

0.02439 

-2.03101 

0.00000 

-0.12812 

38 

38 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

39 

39 

0.13690 

0.03448 

1.95789 

0.17262 

-0.17262 

40 

40 

0.10312 

0.02439 

-2.03101 

0.00000 

-0.12812 

41 

41 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

42 

42 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

43 

43 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

44 

44 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

45 

45 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

Total N 


45 

45 

45 

45 

45 


a Limitado aos primeiros 100 casos. 
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Case Summaries 3 (Resumo dos casos) 



Case 
Number 
(Numero 
do Caso) 

Analog of Cook's 
influence statistics 
(Analogo da estatistica 
de influencia de Cook.) 

Leverage 
value (Valor 
da influencia) 

Normalized 

residual 

(Residuo 

normalizado) 

DFBeta for 
constant 
(DFBeta para 
a constante) 

DFBeta for 
FB(1) 

(DFBeta para 
a FB(1)) 

1 

46 

0.10312 

0.02439 

-2.03101 

0.00000 

-0.12812 

2 

47 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

3 

48 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

4 

49 

0.00932 

0.03448 

-0.51075 

-0.04503 

0.04503 

5 

50 

0.10312 

0.02439 

-2.03101 

0.00000 

-0.12812 

6 

51 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

7 

52 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

8 

53 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

9 

54 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

10 

55 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

11 

56 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

12 

57 

0.10312 

0.02439 

-2.03101 

0.00000 

-0.12812 

13 

58 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

14 

59 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

15 

60 

0.13690 

0.03448 

1.95789 

0.17262 

-0.17262 

16 

61 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

17 

62 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

18 

63 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

19 

64 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

20 

65 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

21 

66 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

22 

67 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

23 

68 

0.10312 

0.02439 

-2.03101 

0.00000 

-0.12812 

24 

69 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

25 

70 

0.00606 

0.02439 

0.49237 

0.00000 

0.03106 

Total N 


25 

25 

25 

25 

25 


a Limitado aos primeiros 100 casos. 


tanciais ou casos influentes tivessem sido 
isolados, voce nao deveria simplesmente eli- 
minar esses casos para melhorar o ajuste do 
modelo. Eles deveriam ser examinados bem 


de perto para tentar descobrir uma boa razao 
de por que eles sao diferentes. Eles podem ser 
um erro de entrada dos dados ou uma situacao 
especial: por exemplo, se a crianga teve difi- 


( - | - 

Dica da Samanta Ferrinho 


'N 



V. 


Voce precisa examinar casos que podem influenciar o modelo de regressao lo- 

gistica. 

• Observe os residuos padronizados: nao mais do que 5% dos casos devem 
ter valores absolutos acima de 2 e nao mais do que 1% devem ter valores 
absolutos acima de 2,5. Qualquer caso com um valor acima de 3 podera ser 
um valor atipico. 

• Procure os valores da distancia de Cook no editor de dados: qualquer valor 
acima de 1 indica um caso que pode estar influenciando o modelo. 

• Calcule a influencia media (o numero de previsores mais um, dividido pelo ta- 
manho da amostra) e procure por valores maiores do que duas ou tres vezes 
a influencia media. 

• Procure por valores absolutos do DFBeta maiores do que 1. 















Descobrindo a Estatistica Usaimdo o SPSS 247 


culdade de prestar atencao na tarefa das falsas 
crengas e voce notou isso quando realizou o 
experimento. Em tal situagao, voce teria um 
bom motivo para excluir o caso e saber as ra- 
zoes para te-lo feito. 

6.5.5 Calculando o tamanho de efeito © 

Ja vimos (Segao 6.3.2) que o SPSS produz 
um valor de r para cada previsor, com base na 
Estatistica de Wald. Isso serve para a medida do 
tamanho de efeito, mas vale a pena ter em men- 
te o que ja foi dito sobre ela: ela nao sera acura- 
da quando a estatistica de Wald e imprecisa! 

6.6 COMO RELATAR A REGRESSAO 
LOGISTICA © 

Em virtude de a regressao loglstica ser 
pouco utilizada, e diflcil encontrar qualquer 
conjunto de procedimentos sobre como rela- 
ta-la! Portanto, o que segue e apenas uma vi- 
sao pessoal do que deve ser apresentado, usan- 
do como base as normas da APA (American 
Psychological Association) para relatar situa- 
goes que envolvem a regressao multipla (veja a 
Segao 5.9). Assim como na regressao multipla, 
sou a favor de tabelar os resultados, a menos 
que ela seja um modelo muito simples. No ml- 
nimo, os valores beta, seus erros padrao e os 
valores da significancia e algumas estatlsticas 
gerais sobre o modelo (como o R 2 e as esta¬ 
tlsticas de aderencia) devem ser apresentados. 
Tambem recomendo relatar o valor de Exp(B) 
e o intervalo de confianga associado. Apre- 
sentar a constante tambem e interessante, pois 


Tabela 6.3 Como relatar a regressao logistica 


desse modo os leitores do seu trabalho poderao 
reconstruir o modelo caso tenham necessidade 
de faze-lo. Considere tambem relatar as varia- 
veis que nao foram previsores significativos, 
pois saber isso pode ser tao util quanto saber 
quais as que foram significativas. Para o exem- 
plo deste capltulo, poderlamos apresentar uma 
tabela semelhante a Tabela 6.3. 

Espero que voce consiga perceber de onde 
os valores surgiram com base no que ja dis- 
cutimos ate aqui. Como na regressao multipla, 
arredondei os valores na segunda decimal. 
Para o R 2 e os betas padronizados nao existe 
um zero antes do ponto decimal (porque esses 
valores nao podem ser maiores do que 1), mas 
para todos os demais valores menores do que 1 
o zero esta presente.* A significancia da varia- 
vel e representada por asteriscos com uma nota 
indicando o nlvel de significancia utilizado. 

6.7 OUTRO EXEMPLO © 

Esse exemplo foi inspirado por eventos 
ocorridos nas finais da Copa do Mundo de Fu- 
tebol de 1998 (esse tipo de frustragao nao e fa- 
cilmente esquecida!). Infelizmente (para mim, 
um ingles), fui sujeitado a ver a Inglaterra ser 
eliminada do campeonato numa disputa de pe- 
naltis. Seis anos depois, acabo de ver (ontem) 


* N. de T.: Como ja foi observado anteriormente, no Bra¬ 
sil nao se costuma fazer essa diferenga, portanto todos 

os valores apresentam o zero antes da virgula. Lembre 
que no sistema ingles e americano o ponto decimal sig- 
nifica, de fato, a virgula. Como a tabela e, em geral, fei- 
ta pelo software, foi mantida a notagao original. 


Intervalo de Confianga de 95% para a exp b 


B(EP) 

Inferior 

Exp b 

Superior 

Incluldo 





Constante 

-1,34* 
(0,46) 

4,84 

15,81 

51,71 

Entendimento de falsas 

2,76** 




crengas 

(0,60) 





Nota: R 2 = 0,27 (Hosmer e Lemeshow), 0,31 (Cox e Snell), 0,42 (Nagelkerke). x 2 (1) do Modelo = 26,08, p < 0,001, * p < 

0,01, ** p < 0,001 
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a Inglaterra ser eli- 
minada do Cam- 
peonato Europeu 
em outra disputa de 
penaltis. Consolo- 
me com o fato de 
que pelo menos 
eles tem consisten- 
cia na sua inepcia. 

Se eu fosse o tecnico da Inglaterra, estaria 
interessado em descobrir que fatores podem 
prever se um jogador vai ou nao perder um 
penalti. Para os que detestam futebol, pensem 
nesse exemplo como fatores que podem prever 
o sucesso em um lance livre do basquete ou 
um saque no volei, um penalti no hoquei ou 
no rugbi 6 ou um chute no futebol americano. 
A questao dessa pesquisa e perfeita para uma 
regressao logfstica porque a nossa variavel 
de safda e dicotomica: um penalti pode virar 
gol ou nao. Imagine que pesquisas anteriores 
(Eriksson, Beckham e Vassell, 2004; Hoddle, 
Batty e Ince, 1998) apontaram dois fatores 
confiaveis que podem prever se um batedor ira 
converter um penalti em gol ou nao. O primei- 
ro fator e se o jogador que ira cobrar o penalti e 
ansioso (esse fator pode ser medido utilizando 
uma escala como o questionario sobre ansieda- 
de da universidade estadual da Pensil vania).* * 
O segundo fator e o sucesso anterior do joga¬ 
dor em bater penaltis (se o jogador acerta co¬ 
ll rancas de penalidades com frequencia). Sabe- 
mos que a ansiedade tem um efeito nocivo no 
desempenho de varias tarefas, portanto, e pos- 
sfvel prever que o estado de ansiedade podera 
ser responsavel por alguma parte da variancia 
nao explicada na cobranca de penaltis. 

Esse exemplo e um caso classico de cons- 
trucao sobre um modelo bem estabelecido, 
pois dois previsores ja sao conhecidos e nos 
queremos testar o efeito de um novo. Assim, 
75 jogadores de futebol foram selecionados 


ao acaso e antes de cobrar um penalti em uma 
competicao eles responderam a um questiona¬ 
rio sobre a ansiedade, fornecendo uma medida 
do quanto eles se preocupavam com as coisas 
em geral. As taxas de sucesso na cobranca de 
penalidades foram obtidas de uma base de 
dados. Finalmente, foi anotado se o jogador 
converteu ou nao o penalti. Os dados podem 
ser encontrados no arquivo penalty.sav, que 
contem quatro variaveis, cada uma em uma 
coluna separada. 

• Scored (convertido): Essa variavel e a 
nossa salda e ela esta codificada como 0 
= errou e 1 = converteu. 

• Pswq (preocupacao): Essa variavel e o pri- 
meiro previsor e fornece uma medida do 
grau de preocupacao do jogador em geral. 

• Previous (anterior): Essa variavel e o per- 
centual de cobrancas convertidas por um 
determinado jogador ao longo de sua car- 
reira. Ela representa o sucesso anterior na 
cobranca de penaltis. 

• Anxious (Ansiedade). Essa variavel e o 
nosso terceiro previsor e nao foi previa- 
mente utilizada para prever o sucesso 
numa cobranca de penalidades. E uma 
medida do estado de ansiedade antes de 
cobrar o penalti. 

6.7.1 Executando a analise: regressao 
por entrada em blocos © 

Para executar a analise, precisamos pri- 
meiro selecionar a caixa de dialogo da re¬ 
gressao logfstica (logistic regression ) e uti- 
lizar o mouse para especificar o caminho 
Analyze=>Regression=>Binary Logistic 
(Analisar=>Regressao =>Logfstica Binaria). 
Nesse exemplo, sabemos que dois previsores 
ja foram testados e e recomendavel entrar com 
eles no modelo na forma de um unico bloco. 
Podemos adicionar o novo previsor em um 
segundo bloco (fazendo isso, estamos exa- 
minando um modelo antigo e depois adicio- 
nando uma nova variavel a esse modelo para 
ver se existe alguma melhoria). Esse metodo e 
conhecido como entrada em blocos e a Figura 
6.8 mostra como ele e especificado. 


6 No entanto, esse exemplo nao seria realista porque o 
nosso time de rugbi, ao contrario do de futebol, tem 
Johnny Wilkinson, o melhor dos cobradores de penaltis 
- palmas pelo seu magmfico pe esquerdo! 

* N. de T.: PSWQ (Penn State Worry Questionnaire) no 
original. 
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* 



Next 


Figura 6.8 Metodo da entrada por blocos na regressao logistica. 


E facil realizar uma regressao com entradas 
em blocos. Primeiro voce deve utilizar o mouse 
para selecionar a variavel scored (convertido) 
da lista de variaveis e depois transferi-la para 
o painel denominado Dependent (Dependente) 
clicando em Ill Segundo, voce deve selecionar 
os dois previsores determinados anteriormente. 
Assim, selecione pswq e previous (anterior) 
da lista de variaveis e transfira-as para o painel 
denominado Covariates (Covariaveis) clicando 
em _!_l. Nosso primeiro bloco de variaveis esta 
agora especificado. Para especificar o segundo 
bloco, clique em M° xl (proximo) a fim de 
limpar o painel das covariaveis, que deve estar 
rotulado agora como Block 2 of 2 (Bloco 2 de 
2). Selecione a variavel anxious (ansiedade) da 
lista de variaveis e faga a transferencia para o 


painel denominado Covariates (Covariaveis) 
clicando em 111 Podemos, nesse estagio, sele¬ 
cionar algumas interagoes para incluir no mo- 
delo, mas a menos que exista alguma boa razao 
teorica para acreditar que os previsores tern 
interagao, nao existe a necessidade de faze-lo. 
Verifique se o Enter esta selecionado como me¬ 
todo de regressao (esse e o metodo padrao e ja 
deve estar selecionado). 

Uma vez que as variaveis tenham sido es- 
pecificadas, voce deve selecionar as opgoes des- 
critas nas Segoes 6.4.4 e 6.4.5. Como nenhum 
dos previsores e categorico, nao ha necessidade 
de usar a opgao Categorical... (Categorico). 
Quando voce tiver selecionado as opgoes e os re- 
siduos que voce quer, retorne a caixa de dialogo 
principal da regressao logistica e clique em 011 . 
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6.7.2 Interpretando saidas (D 

A saida da regressao logistica sera arran- 
jada conforme os blocos que foram especifi- 
cados. Em outras palavras, o SPSS ira produ- 
zir um modelo de regressao para as variaveis 
especificadas no bloco 1 e depois produzira 
um segundo modelo que contera as variaveis 
para os dois blocos. Primeiro, a Saida 6.9 do 
SPSS mostra os resultados do bloco 0: a saida 
nos informa que 75 casos foram aceitos e que 
a variavel dependente foi codificada como 0 e 


1 (porque essa variavel foi codificada como 0 
e 1 no editor de dados, esses codigos corres- 
pondem exatamente aos dados no SPSS). So- 
mos entao informados sobre as variaveis que 
estao na cquacao e as que nao estao na equa- 
gao. Nesse ponto, somente a constante esta in- 
cluida no modelo, e sendo totalmente honesto, 
nenhuma dessas informagoes e interessante! 

Os resultados para o bloco 1 sao mostrados 
na Saida 6.10 do SPSS, e nesta analise nos for- 
gamos o SPSS a adicionar as variaveis previous 


Saida do SPSS 6.9 


Dependent Variable Encoding (Codificacao da Variavel Dependente) 


Original Value (Valor Original) 

Internal Value (Valor Interno) 

Missed Penalty (Penalti Perdido) 

0 

Scored Penalty (Penalti Convertido) 

1 


Block 0: Beginning Block (Bloco 0: Inicial) 


Classificagao Table 4 * (Tabela de classificagao) 


Observed (Observado) 

Predicted (Previstos) 

Result of Penalty Kick 
(Resultado da cobranga) 

Percentage 

Correct 

(Percentatual 

Correto) 

Missed Penalty 
(Penalti Perdido) 

Scored Penalty 
(Penalti Convertido) 

Step 0 Result of Penalty Kick 

Missed Penalty 

0 

35 

0.0 

(Passo 0) (Resultado da cobranga) 

(Penalti Perdido) 






0 

40 

100.0 

Overall Percentage (Per- 

Scored Penalty 



53.3 

centagem Global) 

(Penalti Conver- 





tido) 





a A constante esta incluida no modelo. 
b 0 valor de corte e 0,500. 


Variables in the Equation (Variaveis na equacao) 



B 

S. E. (Erro Padrao) 

Wald 

df (gl) 

Sig. (Sig.) 

Exp(B) 

Step 0 

Constant 

0.134 

0.231 

0.333 

1 

0.564 

1.143 

(Passo 0) 

(Constante) 








Variables not in the Equation (Variaveis fora da equagao) 



Score (Escore) 

df (gl) 

Sig. (Sig.) 

Step 0 

Variables (Variaveis) 

PREVIOUS 

34.109 

1 

0.000 

(Passo 0) 

Overall Statistics (Esta- 

(Anterior) 

PSWQ 

34.193 

1 

0.000 


tisticas Globais) 


41.558 

2 

0.000 
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e pswq no modelo de regressao. Dessa forma, 
essa parte da safda fornece informagoes sobre 
o modelo apos as variaveis previous e pswq 
terem sido adicionadas. Observe que o — 2VL 
e 48,66, ou seja, uma mudanga para menos do 
54,98 (que e o valor dado pelo qui-quadrado 
do modelo). Esse valor nos informa sobre o 
modelo como um todo enquanto que o bloco 
{block) nos informa quanto o modelo melho- 
rou desde o ultimo bloco. A mudanga na quan- 
tia explicada pelo modelo e significativa (p < 
0,0001), assim, utilizar a experiencia previa e a 
preocupagao como previsor aumenta significa- 
tivamente nossa habilidade de prever o sucesso 
na cobranga de penalidades. Um pouco abaixo, 
a tabela de classificagao nos mostra que 84% 
dos casos podem ser corretamente classifica- 
dos utilizando pswp e previous. 

No exemplo das regras de comportamen- 
to, o SPSS nao produziu o teste de aderencia 
de Hosmer e Lemeshow. A razao e que esse 
teste nao pode ser calculado quando existe so- 
mente um previsor e esse previsor e uma varia- 
vel categorica dicotomica! Contudo, para esse 
exemplo o teste pode ser calculado. A parte 
importante desse teste e a propria estatistica 
teste (7,93) e sua significance (0,339). Essa 
estatistica testa a hipotese de que os dados 
observados sao significativamente diferentes 
dos valores previstos pelo modelo. Assim, nos 
queremos um valor nao-significativo para esse 
teste (porque isso indicaria que o modelo nao 
difere significativamente dos dados observa¬ 
dos). Aqui temos um valor nao-significativo, o 
que e um indicativo de que temos um modelo 
que ira prever bem os valores. 

A parte da Saida 6.10 do SPSS denomi- 
nada Variables in the Equation (Variaveis na 
Equagao) nos informa quais os parametros do 
modelo quando previous e pswq sao utiliza- 
dos como previsores. Os valores de signifi¬ 
cancia da estatistica de Wald para cada previ¬ 
sor indicam que tanto pswq quanto previous 
podem prever significativamente o sucesso da 
cobranga de penalti (p < 0,01). Os valores de 
exp b para previous indicam que se o percen- 
tual de penaltis convertidos aumenta em uma 
unidade, as chances de converter um penalti 


tambem aumentam (porque exp b e maior do 
que 1). O intervalo de confianga para esse va¬ 
lor varia de 1,02 a 1,11, portanto, podemos ter 
certeza de que o valor populacional de exp b 
esta em algum ponto entre esses dois valores. 
Alem disso, em virtude dos dois valores se- 
rem maiores do que 1, podemos tambem estar 
confiantes de que o relacionamento entre a va¬ 
riavel previous e o sucesso em converter um 
penalti encontrado na amostra e verdadeiro 
para toda a populagao de jogadores de fute- 
bol. Os valores de exp b para a variavel pswq 
indica que se o nivel de preocupagao aumenta 
por um ponto ao longo da escala de preocu¬ 
pagao da Universidade Estadual da Pensilva- 
nia, entao as chances de converter um penalti 
decresce (porque exp b e menor do que 1). O 
intervalo de confianga para esse valor varia de 
0,68 a 0,93, assim, podemos estar bem con¬ 
fiantes de que o valor populacional de exp b 
esta em algum ponto entre esses dois valores. 
Alem disso, em virtude de os dois valores se- 
rem menores do que 1, podemos ter certeza 
de que o relacionamento entre a variavel pswq 
e o sucesso em bater um penalti encontrado 
nessa amostra pode ser atribuido para toda a 
populagao de jogadores de futebol. Se tives- 
semos encontrado que o intervalo de confian¬ 
ga variasse de um valor menor do que 1 a um 
maior do que 1, isso limitaria a generalizagao 
de nossos achados porque o valor de exp b na 
populagao poderia indicar tanto uma relagao 
positiva (Exp(B) >7) quanto uma negativa 
(Exp(B) < 1). 

Observando o diagrama de classificagao 
(Saida do SPSS 6.11), percebemos que muitos 
casos estao agrupados nos extremos do dia¬ 
grama e poucos casos estao no meio do dia¬ 
grama. Isso reitera o que ja sabemos: o mode¬ 
lo classifica corretamente a maioria dos casos. 
Podemos, nesse ponto, calcular o R 2 (veja a 
Segao 6.3.2) dividindo o qui-quadrado do mo¬ 
delo pelo valor original de —2VL. O resultado 
e mostrado na equagao (6.18) e significa que 
o modelo pode explicar 53% da variancia do 
sucesso na conversao de penalidades (assim, 
aproximadamente metade do que faz um pe¬ 
nalti ser convertido e ainda desconhecido): 
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Saida do SPSS 6.10 

Block 1: Method = Enter (Bloco 1: Metodo = Enter) 


Omnibus Tests of Mode! Coeficientes (Testes em etapas dos coeficientes do modelo) 



Chi-square 

(Qui-quadrado) 

df (gl) 

Sig. (Sig.) 

Step 1 (Passo 1) Step (Passo) 

54.977 

2 

0.000 

Block (Bloco) 

54.977 

2 

0.000 

Model (Modelo) 

54.977 

2 

0.000 


Model Summary (Resumo do Modelo) 


Step (Passo) 

-2 Log likelihood (-2 
Verossimilhanga-log) 

Cox & Snell R Square (R 
quadrado de Cox e Snell) 

Nagelkerke R Square (R 
quadrado de Nagelkerke.) 

1 

48.662 

0.520 

0.694 


Hosmer and Lemeshow Test (Teste de Hosmer e Lemeshow) 


Step (Passo) 

Chi-square (Qui- 
quadrado) 

df (gl) 

Sig. (Sig.) 

1 

7.931 

7 

0.339 


Contingency Table for Hosmer and Lemeshow Test 
(Tabela de contingency para o teste de Hosmer e Lemeshow) 



Result of Penalty Kick = Missed Penalty 
(Resultado da cobranga = Penalti perdido) 

Result of Penalty Kick = 

Scored Penalty (Resultado da 
cobranga = Penalti convertido) 

Total 

Observed 

(Observado) 

Expected 

(Esperado) 

Observed 

(Observado) 

Expected 

(Esperado) 

Step 1 1 

8 

7.904 

0 

0.096 

8 

(Passo 1) 2 

8 

7.779 

0 

0.221 

8 

3 

8 

6.705 

0 

1.295 

8 

4 

4 

5.438 

4 

2.562 

8 

5 

2 

3.945 

6 

4.055 

8 

6 

2 

1.820 

6 

6.180 

8 

7 

2 

1.004 

6 

6.996 

8 

8 

1 

0.298 

7 

7.702 

8 

9 

0 

0.108 

11 

10.892 

11 


a O valor de corte e 0,500. 


Classificagao Table a (Tabela de classificagao) 


Observed (Observado) 

Predicted (Previstos) 

Result of Penalty Kick 
(Resultado da cobranga) 

Percentage 

Correct 

(Percentual 

Correto) 

Missed Penalty 
(Penalti Perdido) 

Scored Penalty 
(Penalti Convertido) 

Step 1 

Result of Penalty 

Missed Penalty (Penalti 

30 

5 

85.7 

(Passo 1) 

Kick (Resultado da 

Perdido) 

7 

33 

82.5 


cobranga) 

Scored Penalty (Penalti 






Convertido) 





Overall Percentage 




84.0 


(Percentagem Global) 






a O valor de corte e 0,500. 


(Continua) 
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Variables in the Equation (Variaveis na equagao) 




S. E. 
(Erro 
Padrao) 





95,0% C.l. for EXP(B) 

(I.C. de 95% para EXP(B» 


B 

Wald 

df (gl) 

Sig. 

(Sig.) 

Exp(B) 

Lower 

(Inferior) 

Upper 

(Superior) 

Step l a PREVIOUS 

(Passo 1) (Anterior) 

0.065 

0.022 

8.609 

1 

0.003 

1.067 

1.022 

1.114 

PSWQ 

Constant 

(Constante) 

-0.230 

1.280 

0.080 

1.670 

8.309 

0.588 

1 

1 

0.004 

0.443 

0.794 

3.598 

0.679 

0.929 


a Variavel(is) adicionadas no passo 1: ANTERIOR, PSWQ. 


Saida do SPSS 6.11 


Observed Groups and Predicted Probabilities (Grupos observados e 
probabilidades previstas) 


F 

R 

E 

Q 

U 

E 

N 

C 

I 

A 

S 


16 + 


I 

I 

I 

12 + 
I 
I 
I 


I MM 
I MM 
I MM 
4 +MM 
I MM 
IMMM 

IMMMM MM M 


M 

M 

M 


Predicted - 
(Previstos) 


M S 
MMS M 


SS 

SM S 
MM S S 


I 

I 

I 

+ 

SI 

SI 

SI 

s+ 

SI 

SI 

SI 

SS+ 



s 


S 

SSI 

s 

SS 

SM 

SSS 

SSSI 

s 

SM 

MSM 

SSM 

SSSSI 


Prob:0 0.25 0.5 0.75 1 

Group s: MMMMMMMMMMMMMMMMMMMMMMMMMMMMMMSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS 

(Grupos) 

Predicted Probability is of Merbership for Scored Penalty 
(Probabilidades previstas sao de inclusao no grupo de penaltis 
convertidos) 


The CUT Value is .50 (O Ponto de Corte e 0,50) 

Symbols: M - Missed Penalty, S - Scored Penalty (Simbolos: M - Penalti 
perdido, S = Penalti Convertido) 

Each Symbol Represents 1 Case (Cada simbolo representa 1 caso) 
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_ qui-quadrado do modelo 
original — 2VL 


103,6358 
= 0,53 

A Saida 6.12 do SPSS mostra o que acon- 
tece ao modelo quando nosso novo previsor 
e adicionado (anxious). Essa parte da saida 
descreve o bloco 2, que e o modelo descrito 
no bloco 1 com o novo previsor adicionado. 
Assim, comegamos com o modelo que ti- 
nhamos no bloco 1 e depois adicionamos o 
previsor anxious (ansioso) a ele. O efeito de 
adicionar o novo previsor ao modelo e reduzir 
o —2VL para 47,416 (uma redugao de 1,246 
a partir do modelo no bloco 1 como mostrado 
pelo qui-quadrado do modelo e a estatistica 
de bloco). Essa melhoria nao e significativa, 
ou seja, o acrescimo da variavel ansioso (an¬ 
xious) ao modelo nao melhorou significativa- 
mente a habilidade de prever se um penalti ira 
virar ou nao um gol. A tabela de classificagao 
nos informa que o modelo esta agora classi- 


ficando corretamente em 85,33% dos casos. 
Lembre que no bloco 1,84% foi classificado 
corretamente, dessa forma, 1,33% a mais dos 
casos sao agora classificados (o que nao e 
grande coisa - examinando a tabela podemos 
ver que apenas um caso novo foi corretamen¬ 
te classificado). 

A segao denominada “Variaveis na Equa- 
gao” contem agora tres previsores e algo inte- 
ressante aconteceu: pswq e ainda um previsor 
significativo do sucesso em converter penali- 
dades, mas a variavel previous nao e mais sig¬ 
nificativa para prever o sucesso de um batedor 
fazer um gol. Alem disso, a ansiedade parece 
nao ter uma contribuigao significativa para a 
previsao do sucesso em converter penaltis. 

Por que a experiencia anterior nao preve 
mais o sucesso na marcagao do gol nem a an¬ 
siedade se a habilidade do modelo de prever 
o sucesso na conversao de penaltis aumentou 
ligeiramente? 

O diagrama de classificagao (Saida 6.13 
do SPSS) e semelhante ao anterior e a contri¬ 
buigao do pswq para a previsao do sucesso em 
marcar o gol praticamente nao esta alterada. O 


Saida do SPSS 6.12 

Block2: Method = Enter (Bloco 2: Metodo = Enter) 


Omnibus Tests of Model Coeficientes (Testes em etapas dos coeficientes do modelo) 



Chi-square 

(Qui-quadrado) 

Df (gl) 

Sig. (Sig.) 

Step 1 Step (Passo) 

1.246 

1 

0.264 

(Passol) Block (Bloco) 

1.246 

1 

0.264 

Model (Modelo) 

56.223 

3 

0.000 


Model Summary (Resumo do Modelo) 


Step 

(Passo) 

-2 Log likelihood 
(-2 Verossimilhanga-log) 

Cox & Snell R Square 
(R quadrado de Cox e Snell) 

Nagelkerke R Square 
(R quadrado de Nagelkerke.) 

i 

47.416 

0.527 

0.704 


Hosmer and Lemeshow Test (Teste de Hosmer e Lemeshow) 


Step 

(Passo) 

Chi-square 

(Qui-quadrado) 

df( gl) 

Sig. (Sig.) 

i 

9.937 

7 

0.192 


(Continua) 
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Contingency Table for Hosmer and Lemeshow Test (Tabela de 
contingencia para o teste de Hosmer e Lemeshow) 



Result of Penalty Kick = Missed Penalty 
(Resultado da cobranga = Penalti perdido) 

Result of Penalty Kick = Scored Penalty 
(Resultado da cobranga = Penalti convertido) 

Total 

Observed 

(Observado) 

Expected 

(Esperado) 

Observed 

(Observado) 

Expected 

(Esperado) 

Step 1 1 

8 

7.926 

0 

0.074 

8 

(Passo 1) 2 

8 

7.769 

0 

0.231 

8 

3 

9 

7.649 

0 

1.351 

8 

4 

4 

5.425 

4 

2.575 

8 

5 

1 

3.210 

7 

4.790 

8 

6 

4 

1.684 

4 

6.316 

8 

7 

1 

1.049 

7 

6.951 

8 

8 

0 

0.222 

8 

7.778 

8 

9 

0 

0.067 

10 

9.933 

10 


a 0 valor de corte e 0,500. 


Classificagao Table a (Tabela de classificagao) 


Observed (Observado) 

Predicted (Previstos) 

Result of Penalty Kick 
(Resultado da cobranga) 

Percentage 

Correct 

(Percentual 

correto) 

Missed Penalty 
(Penalti perdido) 

Scored Penalty 
(Penalti convertido) 

Step 0 Result of Penalty Kick 

Missed Penalty 

30 

5 

85.7 

(Passo 0) (Resultado da cobranga) 

(Penalti perdido) 



85.0 

Overall Percentage (Per- 

Scored Penalty 

6 

34 

85.3 

centagem Global) 

(Penalti convertido) 





a 0 valor de corte e 0,500. 


Variables in the Equation (Variaveis na equagao) 










95,0% C.l. for EXP(B) 

(I.C. de 95% para EXP(B)) 




S. E. (Erro 


df 

Sig. 


Lower 

Upper 



B 

Padrao) 

Wald 

(gi) 

(Sig.) 

Exp IB) 

(Inferior) 

(Superior) 

Step 1 

PREVIOUS 

0.203 

0.129 

2.454 

1 

0.117 

1.225 


1.578 

(Passo 1) 

PSWQ 

-0.251 

0.084 

8.954 

1 

0.003 

0.778 

0.950 

0.917 


ANXIOUS 

0.276 

0.253 

1.193 

1 

1.318 

3.598 

0.660 

2.162 


Constant 

(Constante) 

-11.493 

11.802 

0.948 

1 

0.000 


0.803 



a Variavel(is) adicionada(s) no passo 1: ANSIOSO. 


que mudou foi a contribuicao da experiencia 
anterior. Se examinarmos os valores de exp b 
tanto para a variavel previous quanto para a 
anxious, fica claro que elas tern um relacio- 
namento positivo potencial para o sucesso em 
converter penaltis (isto e, se elas aumentam 
em uma unidade, as chances de conversao me- 
lhoram). Contudo, os intervalos de confian^a 


para esses valores cruzam 1, o que indica que 
a direcao desse relacionamento pode ser ins- 
tavel na populacao corno um todo (isto e, o 
valor de exp b na nossa amostra pode ser total- 
mente diferente do valor se toda a populacao 
for utilizada). 

Voce pode ficar tentado a utilizar esse 
modelo final para afirmar que embora a preo- 
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cupagao nao seja um previsor significativo do 
sucesso na conversao de penaltis, o achado 
anterior de que a experiencia desempenha um 
papel importante e incorreta. Isso seria uma 
conclusao perigosa; vou lhe mostrar o porque. 


6.8 TESTES PARA A 

MULTICOLINEARIDADE (D 

Na Segao 5.6.2.4 vimos como a multico- 
linearidade pode afetar os parametros de um 


Saida do SPSS 6.13 


Observed Groups and Predicted Probabilities (Grupos observados e 
probabilidades previstas) 


F 

R 

E 

Q 

U 

E 

N 

C 

I 

A 

S 


16 + 

I 

I 

I 

12 + 

I 

I 

I 

8 + 

IM 
IM 
I MM 
4 +MM 
I MM 
IMMMM 

IMMMMMM MM M 


M 

M 

M 

M 


S 

S S 

S S MM MMS S 


Predicted-+-+ 

(Previstos) 

Prob. 0 .25 .5 

(Prob.) 


I 

I 

I 

+ 

SI 

SI 

SI 

s+ 

SI 

SI 

s 

ss 

S MS SS 
SM SSMSMM SSSS 


SSI 
SS+ 
SSI 
SSSI 
M SSSSI 


. 75 


1 


Groups MMMMMMMMMMMMMMMMMMMM MMMMMMMMMMSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS 
(Grupos) 

Predicted Probability is of Membership for Scored Penalty 
(Probabilidades previstas sao de inclusao no grupo de penaltis 
convertidos) 

The CUT Value is .50 (0 ponto de corte e 0,50) 

Symbols: M - Missed Penalty, S - Scored Penalty (Simbolos: M - Penalti 
perdido, S = Penalti Convertido) 

Each Symbol Represents 1 Case (Cada simbolo representa 1 caso) 


CASE Observed (Caso observado) 

SCORED Pred PGroup Resid ZResid 

(CONVERTIDO) (Previsto) (Grupo P) (Residuo) (Residuo Z) 

58 S M** .9312 S -.9312 -3.6790 

S = Selected (Selecionado) U = Unselected cases (Casos nao-selecionados) 
** = Misclassified cases (Casos malclassificados) 

* Cases with Studentized residuals greater than 2 are listed 

(Casos com residuos estudentizados maiores do que 2 sao listados) 

The CUT Value is .50 (0 ponto de corte e 0,50) 
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modelo de regressao. A regressao logfstica e 
igualmente suscetfvel ao efeito da colinearidade, 
portanto, e essencial testar a colinearidade numa 
analise de regressao logfstica. Infelizmente, o 
SPSS nao tem uma opgao para fazer um diag- 
nostico de colinearidade na regressao logfstica 
(o que pode criar a ilusao de que nao e necessario 
testa-la!). Contudo, voce pode obter estatfsticas 
tais como as de tolerancia e FIV simplesmen- 
te executando uma analise de regressao linear 
utilizando a mesma variavel de safda e os mes- 
mos previsores. Assim, para o exemplo atual, 
acesse a caixa de dialogo para a regressao li¬ 
near ( regression linear) utilizando o mouse para 
especificar Analyze=> Regressions Linear 
(Analisar=>Regressao=>Linear). A caixa de 
dialogo completa e mostrada na Figura 6.9. E 
desnecessario especificar um monte de opgoes 
(estamos utilizando a tecnica apenas para testar 
a colinearidade), mas e essencial que voce cli¬ 
que em sumoo (Estatfsticas) e depois selecione 
Collinearity diagnostics (diagnosticos de coli¬ 
nearidade) na caixa de dialogo. Uma vez que 
voce selecionou PE?...... desmarque todas 

as opgoes padrao, clique em (continue) 
para voltar a caixa de dialogo da regressao li¬ 
near e clique em <* para executar a analise. 

Os resultados da analise de regressao li¬ 
near sao mostrados na Safda 6.14 do SPSS. Da 
primeira tabela podemos ver que os valores da 


tolerancia sao 0,014 para a variavel previous e 
anxious e 0,575 para a pswq. No Capftulo 5, 
vimos varios criterios para determinar a coli¬ 
nearidade. Menard (1995) sugere que um valor 
da tolerancia menor do que 0,1 provavelmen- 
te indica um problema serio de colinearidade. 
Myers (1990) tambem sugere que um valor 
FIV maior do que 10 e motivo de preocupagao; 
nesses dados os valores estao acima de 70 tanto 
para anxious quanto para previous. Parece, a 
partir desses valores, que existe um problema 
de colinearidade entre as variaveis previsoras. 
Podemos investigar esse problema mais a fundo 
examinando os diagnosticos de colinearidade. 

A Safda do SPSS 6.14 tambem mostra uma 
tabela denominada Diagnosticos de Colineari¬ 
dade ( Collinearity Diagnostics). Nessa tabela, 
sao fornecidos os autovalores da matriz produto 
cruzado, o fndice de condicao e as propor^oes 
das variancias de cada previsor. Se qualquer um 
dos autovalores nessa tabela e muito maior do 
que os demais, a matriz produto cruzado e mal 
condicionada, o que significa que as solucoes 
dos parametros de regressao podem ser bastante 
afetadas por pequenas mudan 9 as nos previsores 
ou na safda. Simplificando, esses valores nos 
dao uma ideia da precisao do nosso modelo: se 
os autovalores sao similares, o modelo derivado 
tem pouca probabilidade de mudar por peque¬ 
nas altera^des nas variaveis mensuradas. O indi- 



Figura 6.9 Caixa de dialogo para a regressao linear para dados de penaltis. 
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Saida 6.14 do SPSS Diagnosticos de Colinearidade para os dados dos penaltis 

Coeficients a (Coeficientes) 



Collinearity Statistics 
(Estatisticas de Colinearidade) 

Model (Modelo) 

Tolerance (Tolerancia) 

VIF 

1 State Anxiety (Estado da Ansiedade) 

0.14 

71.764 

Percentage of previous penalties scored (Percen- 

0.14 

70.749 

tual de penaltis anteriores convertidos) 

Penn State Worry Questionnaire (Questionario de 

0.575 

1.741 

ansiedade da Penn State) 




a. Variavel dependente: Resultado do Penalti Batido. 


Collinearity Diagnostics’ (Diagnosticos de Colinearidade) 


Model Dimension 
(Modelo) (Dimensao) 

Eingenvalue 

(Autovalor) 

Condition 
Index 
(Indice de 
Condigao) 

Variance Proportions (Proporgoes da Variancia) 

(Constant) 

(Constante) 

State 
Anxiety 
(Estado da 
Ansiedade) 

Percentage 
of previous 
penalties scored 
(Percentual de 
penaltis anteriores 
convertidos) 

Penn State 
Worry 

Questionnaire 
(Questionario 
de ansiedade 
da Penn State) 

i i 

3.434 

1.000 

0.00 

0.00 

0.00 

0.01 

2 

0.492 

2.641 

0.00 

0.00 

0.00 

0.04 

3 

7.274E-02 

6.871 

0.00 

0.01 

0.00 

0.95 

4 

5.195E-04 

81.303 

1.00 

0.99 

0.99 

0.00 


a Variavel dependente: Resultado do Penalti Batido. 


ce de condigao e outra forma de expressar esses 
autovalores, e e determinado pela raiz quadrada 
da razao do maior autovalor pelo autovalor de 
interesse (assim, para a dimensao com o maior 
autovalor, o rndice de condigao sera sempre 1). 
Para esses dados, a dimensao final tem um fndi- 
ce de condigao de 81,3, que e enorme se com- 
parado com as demais dimensoes. Embora nao 
existam regras sobre o quao grande um fndice 
de condigao deva ser para indicar problemas de 
colinearidade, esse caso mostra claramente que 
o problema existe. 

A etapa final da observagao dessa tabela e 
analisar a proporgao das variancias. A varian- 
cia de cada coeficiente da regressao pode ser 
dividida entre os autovalores, e as proporgoes 
das variancias nos informam qual percentual 
da variancia de cada coeficiente da regressao 
dos previsores e atribuldo a cada autovalor. 
Essas proporgoes podem ser pensadas como 
percentuais para facilitar a compreensao. As¬ 
sim, por exemplo, para o previsor pswq, 95% 


da variancia do coeficiente da regressao esta 
associada com o autovalor mimero 3, 4% esta 
associada com o autovalor numero 2 e 1 % e 
associada ao autovalor numero 1. Em termos 
de colinearidade, estamos procurando por pre¬ 
visores que apresentam altas proporgoes no 
mesmo pequeno autovalor, porque isso ira in¬ 
dicar que a variancia dos seus coeficientes de 
regressao sao dependentes. Desse modo, es¬ 
tamos interessados principalmente nas poucas 
linhas no final da tabela (que representam pe- 
quenos autovalores). Nesse exemplo, 99% da 
variancia nos coeficientes de regressao tanto 
do previsor anxiety quanto do previous estao 
associadas ao autovalor numero 4 (o menor de 
todos os autovalores), o qual indica, claramen¬ 
te, uma dependencia entre essas variaveis. 

O resultado dessa analise e bem claro: 
existe uma colinearidade entre o estado da 
ansiedade e a experiencia previa em bater 
penaltis e essa dependencia resulta em um 
modelo viciado. Para ilustrar de onde essa co- 
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linearidade surge, a Saida 6.15 do SPSS mos- 
tra o resultado da correlagao de Pearson entre 
todas as variaveis nessa analise de regressao 
(voce pode executar por si mesmo esse tipo 
de analise). A partir dessa safda, podemos ver 
que os previsores anxious e previous estao 
altamente correlacionados de forma negativa 
(r = —0,99); de fato, eles estao quase perfeita- 
mente correlacionados. Tanto previous quan¬ 
to anxious se correlacionam com o sucesso na 
conversao dos penaltis 7 , mas em virtude deles 
estarem altamente correlacionados entre si, 


7 Alguns podem questionar se e legi'timo calcular a cor¬ 
relagao de Pearson com uma variavel dicotomica tal 
como o sucesso na conversao de um penalti; contudo, 
isso e simplesmente fazer uma correlagao ponto-bisse- 
rial, descrita no Capftulo 4. 


nao fica claro qual preve o sucesso em bater 
um penalti na regressao. 

Essa discussao suscita a questao do que 
fazer quando identificamos uma colinearida- 
de. Bern, nao ha muito que fazer. Uma so- 
lugao logica e retirar uma das variaveis (por 
exemplo, voce pode ficar com o modelo do 
bloco 1, que ignorou o estado da ansiedade). 
O problema dessa opgao e obvio: nao existe 
uma maneira de saber qual variavel retirar. A 
conclusao teorica resultante e. dessa forma, 
sem sentido porque, estatisticamente falan- 
do, qualquer uma das variaveis envolvidas na 
colinearidade pode ser omitida. Resumindo, 
estatisticamente, nao ha problema em omitir 
uma variavel em relagao a outra. Igualmen- 
te, se um previsor e removido, Bowerman e 


Saida 6.15 do SPSS 

Correlations (Correlaqoes) 



Result of Penalty 
Kick (Resultado 
de Cobranga 
de Penalti) 

State 
Anxiety 
(Estado da 
Ansiedade) 

Percentage 
of previous 
penalties scored 
(Percentual de 
penaltis anteriores 
convertidos) 

Penn State 
Worry 

Questionnaire 
(Questionario 
de ansiedade 
da Penn State) 

Result of Penalty 

Pearson Correia- 

1.000 

-0.668** 

0.674** 

-0.675** 

Kick (Resultado de 

tion (Correlagao de 





Cobranga de Penalti) 

Pearson) 






Sig. (2-tailed) (Sig,) 


0.000 

0.000 

0.000 


(Bilateral) 






N 

75 

75 

75 

75 

State Anxiety (Esta- 

Pearson Correia- 

-0.668** 

1.000 

-0.993** 

0.652** 

do da Ansiedade) 

tion (Correlagao de 






Pearson) 






Sig. (2-tailed) (Sig,) 

0.000 


0.000 

0.000 


(Bilateral) 






N 

75 

75 

75 

75 

Percentage of 

Pearson Correia- 

0.674** 

-0.993** 

1.000 

-0.644** 

previous penalties 

tion (Correlagao de 





scored (Percentual 

Pearson) 





de penaltis anterio- 

Sig. (2-tailed) (Sig,) 

0.000 

0.000 


0.000 

res convertidos) 

(Bilateral) 






N 

75 

75 

75 

75 

Penn State Worry 

Pearson Correia- 

-0.675** 

0.652** 

-0.644** 

1.000 

Questionnaire 

tion (Correlagao de 





(Questionario de 

Pearson) 





ansiedade da Penn 

Sig. (2-tailed) (Sig,) 

0.000 

0.000 

0.000 


State 

(Bilateral) 






N 

75 

75 

75 

75 


** A correlagao e significativa ao nlvel de 0,01 (bilateral). 
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O’Connell (1990) afirmam que outro previ¬ 
sor igualmente importante que nao tenha tal 
colinearidade forte deve substitui'-lo. Eles 
tambem sugerem que se coletem mais dados 
para ver se a multicolinearidade pode ser re- 
duzida. Outra possibilidade quando existem 
varios previsores envolvidos na multicoli¬ 
nearidade e executar uma analise de fatores 
nesses previsores e utilizar os escores dos 
fatores resultantes como um previsor (ver o 
Capitulo 15). A opgao mais segura (embora 
insatisfatoria) e reconhecer a instabilidade do 
modelo. Assim, se voce esta relatando uma 
analise de quais fatores preveem o sucesso na 
cobranca de um penalti, podemos reconhe¬ 
cer que a experiencia previa preve de forma 
significativa o sucesso no primeiro modelo, 
mas expor que essa experiencia podera afe- 
tar a cobranga do penalti pelo aumento do 
estado de ansiedade. Essa afirmagao sera 
altamente especulativa porque a correlagao 
entre as variaveis anxious e previous nada 
indica sobre a diregao da causalidade, mas 
ela valida a inexplicavel conexao entre os 
dois previsores. Estou certo de que muitos de 
voces podem julgar a falta de solugoes para a 
colinearidade insatisfatoria - infelizmente, a 
estatlstica e frustrante as vezes! 

6.9 0 QUE PODE DAR ERRADO © 

O SPSS resolve problemas de regressao 
loglstica por um procedimento interativo; ele 
sup5e uma solugao provavel, testa para ver 
quao bem essa solugao adere aos dados e en- 
tao repete o processo para tentar melhorar o 
ajuste. Ele para quando a suposigao feita es- 
tiver perto o suficiente da verdadeira solugao. 
Algumas vezes, em vez de ir rapidamente 
para a solugao correta, voce ira notar que nada 
acontece: o SPSS comega a se mover muito 
devagar. Se voce nao consegue encontrar uma 
solugao correta, as vezes ele desiste oferecen- 
do a voce (sem qualquer desculpa) um resulta- 
do completamente errado. Normalmente isso 
e revelado por um erro padrao absurdamente 
grande. Duas situagoes podem provocar esse 
tipo de ocorrencia. 


6.9.1 Informagao incompleta dos 
previsores © 

Imagine que voce esta tentando prever a 
ocorrencia de cancer de pulmao a partir do ha- 
bito de fumar (vlcio que, acredita-se, aumen- 
ta o risco de cancer) e comer ou nao tomates 
(que, acredita-se, reduz o risco de cancer). 
Voce coleta dados de pessoas fumantes e nao 
fumantes e de pessoas que comem e que nao 
comem tomates; contudo, isso nao e suficien¬ 
te, a menos que voce colete dados de todas as 
combinagoes de fumar e comer tomates. Ima¬ 
gine que voce conseguiu os seguintes dados: 


Voce fuma? 

Voce come 
tomates? 

Voce tem 
cancer? 

Sim 

Nao 

Sim 

Sim 

Sim 

Sim 

Nao 

Nao 

Sim 

Nao 

Sim 

????? 


Observar apenas as tres primeiras possi- 
bilidades nao o prepara para a salda da quarta. 
Nao e possivel saber se a ultima pessoa tem 
ou nao cancer com base nos dados coletados. 
Dessa forma, o SPSS tera problemas a me¬ 
nos que voce tenha coletado dados de todas 
as combinagoes das suas variaveis. Isso deve 
ser verificado antes de executar a analise utili- 
zando uma tabulagao cruzada; descrevo como 
fazer isso no Capitulo 16. 

Isso se aplica nao apenas para as variaveis 
categoricas, mas tambem para as contlnuas. 
Suponha que voce quer investigar fatores rela- 
cionados a felicidade. Isso podera incluir ida- 
de, genera, orientagao sexual, crengas religio- 
sas, nlveis de ansiedade e mesmo se a pessoa e 
destra. Voce entrevista 1000 pessoas, registra 
as caracterlsticas e se elas sao ou nao felizes 
(“sim” ou “nao”). Embora a amostra de 1000 
parega bastante grande, e provavel que ela 
inclua uma mulher budista, lesbica, canho- 
ta e altamente ansiosa de 80 anos? Se voce 
achasse tal pessoa e ela fosse feliz, voce po- 
deria concluir que qualquer uma com as mes- 
mas caracterlsticas e feliz? Seria, obviamente, 
necessario ter muito mais pessoas com essas 
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caracterfsticas para confirmar que essa combi- 
nagao de valores proporciona felicidade. 

Como regra geral, sempre que amostras 
sao divididas em categorias e uma ou mais 
combinacoes estiverem vazias teremos proble- 
mas. Isso sera representado por coeficientes 
que apresentam erros padrao anormalmente 
grandes. Pesquisadores conscienciosos produ- 
zem e verificam tabulacoes cruzadas multifor¬ 
mes de todas as vaiaveis categoricas indepen- 
dentes. Os preguigosos, mas cautelosos, nao 
irao se incomodar com tabula- 
goes cruzadas, porem, irao olhar 
cuidadosamente os erros padrao. 

Aqueles que nao se preocupam 
com nada disso terao problemas. 

6.9.2 Separagao 
completa © 

Uma segunda situagao em 
que a regressao logfstica malo- 
gra pode lhe surpreender: quan- 
do a variavel de safda pode ser 
perfeitamente prevista por uma 
variavel ou uma combinagao 
de variaveis! Isso e conhecido 
como separacao completa. 

Vamos ilustrar com um exemplo: imagine 
que voce colocou uma almofada de pressao 
embaixo do seu tapete da porta de entrada e 
conectou a almofada ao sistema de seguranga, 
de modo que voce possa detectar 
ladroes se eles tentarem entrar a 
noite. Contudo, os filhos adoles- 
centes (que voce tera se for velho 
e rico o suficiente para possuir um 
sistema de seguranga e almofadas 
de pressao) e seus amigos podem 
chegar no meio da noite. Quando 
eles pisarem no tapete, voce quer 
determinar a probabilidade de que 
a pessoa e um ladrao e nao um 
adolescente. Para tanto, voce pode 
pesar alguns ladroes e adolescen- 
tes e utilizar a regressao logfstica 
para prever a safda (ladrao ou ado¬ 


lescente) a partir do peso. O grafico ira mos- 
trar uma linha de triangulos em 0 (os pontos de 
dados dos adolescentes que voce mediu) e uma 
linha de triangulos em 1 (os pontos de dados 
dos ladroes que foram pesados). Note que essas 
linhas de triangulos se sobrepdem (alguns ado¬ 
lescentes sao tao pesados quanto os ladroes). Vi- 
mos que numa regressao logfstica, o SPSS tenta 
prever a probabilidade de uma safda dado um 
valor do previsor. Nesse caso, com pesos baixos 



a probabilidade ajustada segue a linha inferior 
do diagrama e com pesos altos ela segue a linha 
superior. Em valores intermediaries, ela tenta 
seguir a probabilidade como ela muda. 
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Imagine que nos temos a mesma almo- 
fada de pressao, se mudou e foi para a uni- 
versidade. Agora estamos interessados em 
distinguir ladroes de gatos de estimagao com 
base no peso. Novamente, podemos pesar al- 
guns gatos e alguns ladroes. Dessa vez o gra- 
fico ainda tern uma linha de triangulos em 0 
(os pesos dos gatos) e uma linha 1 (os dos la¬ 
droes), mas agora as linhas dos triangulos nao 
se sobrepoem, pois nao existe um ladrao que 
pese o mesmo que um gato. Isso e conhecido 
como uma separacao perfeita: a salda (gato 
ou ladrao) pode ser prevista perfeitamente 
a partir dos pesos (qualquer coisa abaixo de 
15 kg e um gato e qualquer coisa acima de 
40 kg e um ladrao. Se tentarmos calcular as 
probabilidades de uma salda dado certo peso, 
estaremos encrencados. Quando o peso e bai- 
xo, a probabilidade e zero, e quando e alto, 
a probabilidade e 1, mas o que acontece no 
meio? Nao temos dados entre 15 e 40 em que 
basear essas probabilidades. A figura mostra 
duas curvas posslveis que podem ser ajustadas 
a esses dados, sendo que uma e bem mais In- 
greme que a outra. Qualquer uma dessas cur¬ 
vas e valida com base nos dados que temos. A 
falta de dados fara com que o SPSS nao tenha 
certeza de quao Ingreme deve ser a inclinagao 
intermediaria e ele tentara trazer o centra o 
mais proximo posslvel da vertical e estimara a 
mudanga em diregao ao infinito (com grandes 
erros padrao). 

Esse problema as vezes ocorre quando 
muitas variaveis sao ajustadas a poucos casos. 
Em muitos casos, a unica solugao satisfatoria 
e coletar mais dados, mas algumas vezes uma 
resposta e encontrada adotando um modelo 
mais simples. 

6.10 0 QUE DESCOBRIMOS SOBRE 
ESTATISTICA? ® 

Aprendi muito escrevendo este capltulo 
(como ignorar meu cerebro quando ele pen- 
sa “Eu sei o que seria otimo colocar no meu 
livro, o capltulo de regressao loglstica!”). Pelo 
menos, espero que eu tenha conseguido dis- 
fargar a minha incompetencia pelo menos na 


maior parte do tempo. Comegamos o capltulo 
entendendo por que nao podemos utilizar a re¬ 
gressao linear (Capltulo 5) quando temos uma 
variavel de salda dicotomica. Estudamos entao 
um pouco de teoria sobre a regressao loglstica 
analisando a equagao de regressao e seu signi- 
ficado. Depois, avaliamos o modelo e falamos 
sobre a estatlstica verossimilhanga-log e o 
teste qui quadrado associado. Abordei os dife- 
rentes metodos de obter valores equivalentes 
ao R 2 na regressao (Hosmer e Lemeshow, Cox 
e Snell e Nagelkerke). Descobrimos tambem a 
estatlstica de Wald e o Exp(B). O restante do 
capltulo apresentou dois exemplos utilizando 
o SPSS para executar a regressao loglstica. 
Com isso, espero que voce tenha compreen- 
dido de forma geral como conduzir e executar 
uma regressao loglstica. 

6.11 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• -2VL 

• Distribuigao qui-quadrado 

• Separagao completa 

• *cs de Cox e Snell 

• Exp(B) 

• de Hosmer e Lemeshow 

• Regressao Loglstica 

• Verossimilhanga-log 

• Estimagao de maxima verossimilhanga 

• R de Nagelkerke 

• Chances 

• Estatlstica do escore eficiente de Roa 

• Estatlstica de Wald 

6.12 TAREFAS DO ALEX ESPERTO 

As respostas dessas tarefas 
- estao no site www.artmed.com. 

\ • br no arquivo Answers(Chap- 

VV ter6).pdf. 

• Pesquisas recentes mostraram que os pro- 
fessores estao entre os trabalhadores mais 
estressados. Uma pesquisadora quer sa¬ 
ber quais os fatores que provocam estres- 
se em um professor. Ela entrevistou 467 
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professores e utilizou varios questionarios 
que mediram: burnout (colapso) (teve ou 
nao), perceived control (controle perce- 
bido) (escore alto = controle percebido 
baixo), coping style (estilo de enfrentar) 
(escore alto = alta habilidade de enfren¬ 
tar o estresse), stress from teaching (es- 
tresse de ensinar) (escore alto = lecionar 
estressa muito a pessoa), stress from 
research (estresse de pesquisar) (escore 
alto = pesquisar provoca muito estresse 
na pessoa) e stress from providing pas¬ 
toral care (estresse de aconselhar) (esco¬ 
re alto = aconselhamento provoca muito 
estresse na pessoa). A variavel de safda de 
interesse e burnout (colapso), e o modelo 
de estresse de Cooper, Sloan e Williams 
(1988) indica que o controle percebido 
(perceived control) e o estilo de enfrentar 
(coping style) sao previsores importantes 
dessa variavel. Os previsores restantes 
foram medidos para ver a sua contribui- 
cao sobre diferentes aspectos do trabalho 
do professor e seu colapso nervoso. Voce 
pode ajudar a pesquisadora realizando 
uma regressao logfstica a fim de ver quais 
fatores preveem o colapso nervoso? Os 
dados estao no arquivo Burnout.sav. © 
Um psicologo clfnico esta interessado em 
pesquisar sobre o HIV e quer saber os fa- 
tores que influenciam o uso do preservati¬ 
ve com uma nova parceira (relacionamen- 
tos com menos de um mes de duragao). A 
medida de safda e seo preservative foi ou 
nao-utilizado (use = preservative utilizado 
= 1, not used = preservative nao-utilizado 
= 0). As variaveis previsoras foram princi- 
palmente resultados obtidos da utilizagao 
da EAP (Escala de Atitudes em relagao ao 
Preservative)* de Sacco, Levine, Reed e 
Thompson ( Psychological Assesment: 
A Journal of Consulting and Clinical 
Psychology, 1991). Gender (Genero - 
genero da pessoa); Safety (Seguranga - 


relacionamento seguro medido em uma 
escala de cinco pontos indicando o grau 
em que a pessoa ve a seguranga do rela¬ 
cionamento em relagao a doengas sexual- 
mente transmissfveis); Sexexp (experien- 
cia sexual, medida em uma escala de 10 
pontos indicando o grau em que experien- 
cias anteriores influenciam a atitude em 
relagao ao uso de preservatives); previous 
(uma medida fora da escala EAP, que in¬ 
dica se o preservative foi ou nao utilizado 
pelo casal em encontros anteriores, 1 = 
preservative utilizado, 0 = preservative 
nao utilizado, 2 = nao houve encontro 
anterior com essa parceira); selfcon (au- 
tocontrole medido em uma escala de nove 
pontos, indicando o autocontrole da pes¬ 
soa quando chega o momento de utilizar o 
preservativo; isto e, eles se deixaram levar 
pelo momento ou se controlaram?); Per¬ 
ceive (risco percebido, medido em uma 
escala de seis pontos, indicando o grau 
de preocupagao da pessoa em relagao ao 
sexo desprotegido). Pesquisas anteriores 
(Sacco, Rickman, Thompson, Levine e 
Reed, em AIDS Education and Preven¬ 
tion, 1993), mostraram que genero, re¬ 
lacionamento seguro e risco percebido 
preveem o uso de preservativo. Execute 
uma analise apropriada para verificar es¬ 
ses resultados anteriores e testar se auto¬ 
controle, utilizagao anterior e experiencia 
sexual podem prever qualquer variancia 
restante na utilizagao de preservativo. (1) 
Interprete todas as partes importantes da 
safda do SPSS. (2) Quao confiavel e o 
modelo final? (3) Quais sao as probabili- 
dades que os participantes 12, 53 e 75 irao 
utilizar preservatives? (4) Uma mulher 
utilizou preservativo em seu encontro an¬ 
terior com um novo parceiro, e apresenta 
2 em todas as variaveis exceto em risco 
percebido (na qual ela tern um escore de 
6). Utilize o modelo para estimar a proba- 
bilidade de que ela ira utilizar preserva¬ 
tivo em seu proximo encontro. Os dados 
estao no arquivo condom.sav. © 


N. deT.: CAS (Condom Attitude Scale). 
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6.13 LEITURAS COMPLEMENTARES 

HUTCHESON, G., SOFRONIOU, N. The 
multivariate social scientist. London: Sage, 
1999. Capftulo 4. 

MENARD, S. Applied logistic regression analysis. 
Sage university paper series on quantitative 
applications in the social sciences. Thousand 


Oaks (CA): Sage. 1995, pp. 07-106. Esse e um 
texto avanqado, mas bom. Infelizmente, poucos 
textos basicos incluem a regressao logfstica, 
portanto, voce tera que confiar no que eu escrevi! 

MILES, J., SHEVLIN, M. Applying regression and 
correlation: a guide for students and researchers. 
London: Sage, 2001. O Capftulo 6 apresentauma 
bela introdugao a regressao logfstica. 



7 

COMPARANDO DUAS MEDIAS 


7.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 

Em vez de olhar os relacionamentos en- 
tre variaveis, os pesquisadores as vezes estao 
interessados em verificar as diferengas entre 
grupos de pessoas. Em pesquisas experi- 
mentais em geral queremos manipular o que 
acontece as pessoas para que possamos fazer 
inferencias causais. Por exemplo, se tomar- 
mos dois grupos de pessoas e aleatoriamente 
designarmos um grupo a um programa de 
pflulas dieteticas e o outro grupo a um pro¬ 
grama de pflulas de aciicar (que eles acham 
que ira auxilia-los na perda de peso), se as 
pessoas que tomam as pflulas dieteticas per- 
derem mais peso do que as que tomam pflu¬ 
las de agucar podemos inferir que as pflulas 
dieteticas causaram a perda de peso. Isso e 
uma ferramenta poderosa de pesquisa por- 
que vai alem da mera observagao de varia- 


1 As pessoas as vezes ficam confusas e pensam que certos 
procedimentos estati'sticos permitem inferencias causais 
e outros nao. Isso nao e verdade; e o fato de que em expe- 
rimentos nos manipulamos uma variavel sistematicamen- 
te para ver seu efeito em outra que permite a inferencia 
causal. Em outras formas de pesquisa, meramente obser- 


veis e da procura por relacionamentos (como 
na correlagao e regressao). 1 Este capftulo e o 
primeiro de muitos que aborda esse tipo de 
linha de pesquisa e comegamos com o cena- 
rio mais simples: quando temos dois grupos 
ou, para ser mais especifico, quando quere¬ 
mos comparar duas medias. Como veremos, 
existem duas maneiras de coletar dados: po¬ 
demos expor diversas pessoas a diferentes 
manipulagoes experimentais ( entre grupos 
ou delineamento independente) ou tomar um 
unico grupo de pessoas e expo-lo a diferen¬ 
tes manipulacoes experimentais em pontos 
diferentes no tempo (um delineamento de 
medidas repetidas). Primeiro veremos como 
fazer um grafico desses diferentes tipos de 
dados e, entao, veremos os procedimentos 
estati'sticos para analise de delineamentos 
independentes (o teste t independente). De- 
pois, seguimos para o delineamento de me¬ 
didas repetidas (o teste t dependente). 


vamos mudangas em variaveis sem qualquer intervengao 
do investigador e, assim, nao podemos dizer qual variavel 
causa a mudanga na outra, mas apenas que elas mudam 
de uma maneira especifica. Como voces irao ver os pro¬ 
cedimentos estatfsticos para analisar os diferentes tipos 
de dados sao, na verdade, matematicamente identicos! 
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7.2 REVISAO DA PESQUISA 
EXPERIMENTAL ® 

Geralmente, nas ciencias sociais nao es- 
tamos apenas interessados em ver quais as va- 
riaveis que covariam ou preveem uma safda. 
Em vez disso, queremos olhar para o efeito 
de uma variavel em outra pela alteragao sis- 
tematica de alguns aspectos daquela variavel. 
Assim, em vez de coletar dados que ocorrem 
naturalmente como na correlagao e regressao, 
manipulamos uma variavel para observar seus 
efeitos em outra. Como um caso simples, po- 
demos querer ver qual o efeito que um incen- 
tivo positivo tem no aprendizado sobre esta- 
tfstica. Posso, portanto, dividir aleatoriamente 
alguns estudantes em dois grupos diferentes: 

• Grupo 1 (estfmulo positivo): Durante as 
aulas, parabenizo todos os estudantes nes- 
se grupo pelo seu esforgo e sucesso. Mes- 
mo quando as pessoas fazem algo errado, 
eu as apoio e digo coisas como “voce qua- 
se acertou, esta progredindo muito bem” 
e dou um chocolate para o estudante. 

• Grupo 2 (estimulo negativo): Esse gru¬ 
po recebe uma aula padrao; assim, prati- 
co abuso verbal mesmo quando os alunos 
fornecem a resposta correta. Nao valori- 
zo suas contribuigoes, sou condescenden- 
te e desdenho tudo o que dizem. Chamo 
os estudantes de estupidos, ignorantes e 
afirmo que eles nao deveriam estar fazen- 
do esse curso. 

A variavel que 
manipulei e o meto- 
do de ensino (esti¬ 
mulo positivo versus 
estfmulo negativo). 
Essa variavel e co- 
nhecida como va- 
ridvel independente 
(VI) e essa situagao 
tem dois nfveis por- 
que ela foi manipulada de duas maneiras (isto e, 
o estfmulo foi dividido em dois tipos: positivo e 
negativo). Uma vez conduzida essa manipula- 
gao, preciso ter algum tipo de safda que estou 
interessado em medir. Nesse caso, e a habilida- 


de estatfstica, e eu posso medir essa variavel 
usando os resultados da prova do final do ano. 
Essa variavel de safda e conhecida como varia¬ 
vel dependence ou VD porque assumimos que 
esses escores irao depender do tipo do metodo 
de ensino utilizado (a variavel independente). 

7.2.1 Os dois metodos de coletar 
dados CD 

Podemos escolher entre dois metodos 
de coleta de dados. O primeiro e manipular 
a variavel independente usando participantes 
diferentes. Esse e o metodo descrito acima, 
em que diferentes grupos de pessoas fazem 
parte de cada condigao experimental ( entre 
grupos, entre participantes ou delineamento 
independente). O segundo metodo e manipu¬ 
lar a variavel independente usando os mesmos 
participantes. Simplificando, esse metodo sig- 
nifica que damos a um grupo de estudantes 
estfmulo positivo por algumas semanas e tes- 
tamos suas habilidades estatfsticas e, depois, 
damos a esse mesmo grupo estfmulo negativo 
por algumas semanas antes de testa-los nova- 
mente ( delineamento dentre participantes ou 
de medidas repetidas ). A maneira na qual os 
dados sao coletados determina o tipo de teste 
que sera utilizado para analisar os dados. 

7.2.2 Dois tipos de variagao ® 

Imagine que voce usou o delineamento 
de medidas repetidas num experimento que 
tem duas condigoes. Portanto, os mesmos 
participantes participam em ambas as condi¬ 
goes, ou seja, medimos o comportamento dos 
participantes na condigao 1 e na condigao 2. 
Por exemplo, suponha que estamos tentando 
ver se conseguimos treinar chimpanzes para 
administrar a economia. Em uma fase do trei- 
no, eles sentam na frente de um computador 
e clicam teclas que mudam varios parametros 
da economia; uma vez que esses parametros 
mudaram, uma figura aparece na tela indican- 
do o crescimento economico resultante desses 
parametros. Como chimpanzes nao sabem ler, 
essa realimentagao nao tem sentido. A segun- 
da fase de treino e a mesma, exceto que, se 
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o crescimento da economia for bom, eles ga- 
nham uma banana (se o crescimento e ruim, 
eles nao ganham) - essa realimentagao e va- 
liosa para o chimpanze. 

Vamos parar um pouco e pensar no que 
teria acontecido se nao tivessemos introduzido 
uma manipulagao experimental (isto e, nao hou- 
vesse bananas na segunda fase de treinamento, 
assim, as condigbes 1 e 2 seriam identicas). Se 
nao ha manipulagao experimental, esperamos 
que o comportamento de um chimpanze seja 
o mesmo em arnbas as condigbes. Esperamos 
isso porque fatores externos como idade, gene¬ 
ra, QI, motivacao e excitacao serao os mesmos 
em ambas as condigbes (o genera do chimpan¬ 
ze etc. nao mudara da condicao 1 para a condi¬ 
gao 2). Se o desempenho da medigao e confia- 
vel (isto e, testa quao bem eles administraram 
a economia) e a variavel ou a caracterfstica que 
estamos medindo (nesse caso, a habilidade de 
administrar a economia) permanece estavel, 
entao o desempenho do participante na con¬ 
dicao 1 devera estar altamente relacionado ao 
seu desempenho na condicao 2. Assim, chim¬ 
panzes que tiveram um alto desempenho na 
condigao 1 terao tambem um alto desempenho 
na condicao 2, e aqueles que tiveram baixo de¬ 
sempenho na condigao 1 terao baixo desempe¬ 
nho na condigao 2. Entretanto, o desempenho 
nao sera identico; havera pequenas diferengas 
no desempenho criadas por fatores desconheci- 
dos. Essa variagao no desempenho e conhecida 
como variagao nao-sistematica. 

Se introduzirmos uma manipulagao expe¬ 
rimental (isto e, fornecermos bananas como 
feedback em uma das segoes do treinamento), 
diferenciamos o tratamento dos participantes 
da condigao 1 e da condigao 2. Assim, a unica 
diferenga entre as condigbes 1 e 2 e a mani¬ 
pulagao que o investigador fez (nesse caso, os 
chimpanzes receberam bananas como uma re- 
compensa positiva em uma condigao, mas nao 
na outra). Portanto, qualquer diferenga entre 
as medias das duas condigoes e, provavel- 
mente, devido a manipulagao do experimento. 
Assim, se os chimpanzes desempenharam me- 
lhor numa fase do que na outra, isso deve ter 
ocorrido porque bananas foram usadas para 


fornecer um reforgo ou realimentagao em uma 
fase de treinamento e nao na outra. As diferen¬ 
gas no desempenho criadas por uma manipu¬ 
lagao experimental especffica sao conhecidas 
como variagao sistemdtica. 

Agora, vamos pensar no que acontece 
quando usamos participantes diferentes - um 
delineamento independente. Nesse delinea- 
mento ainda teremos duas condigbes, mas, 
dessa vez, participantes diferentes participam 
em cada condigao. Voltando para o nosso 
exemplo, um grupo de participantes recebe 
treinamento sent realimentagao e o segundo 
grupo de diferentes chimpanzes recebe reforgo 
para o seu desempenho via bananas 2 . Imagine, 
novamente, que nao temos uma manipulagao 
experimental. Se nada fizessemos com os gru- 
pos, ainda encontrarfamos alguma variagao 
de comportamento entre eles, porque diferen¬ 
tes chimpanzes irao variar na sua habilidade, 
motivagao, QI e outros fatores. Resumindo, o 
tipo de fatores que eram mantidos constantes 
no delineamento de medidas repetidas esta li- 
vre para variar no delineamento independente. 
Assim, a variagao nao-sistematica sera maior 
do que para o delineamento de medidas repeti¬ 
das. Se novamente introduzimos uma manipu¬ 
lagao (isto e, bananas), mais uma vez teremos 
variagao adicional criada por essa manipula¬ 
gao. Como tal, tanto no delineamento de me¬ 
didas repetidas quanto no delineamento inde¬ 
pendente ha sempre duas fontes de variagao: 

• Variagao sistematica: Essa variagao 
ocorre porque o investigador faz algo a 
todos os participantes em uma condigao, 
mas nao na outra. 

• Variagao nao-sistematica: Essa variagao 
resulta de fatores aleatorios que existem 
entre as condigbes experimentais (tais 
como diferengas naturais em habilidades). 


2 Quando eu digo “via”, nao significa que as bananas 
tem pequenas bocas e falaram “muito bem camarada, 
a economia cresceu desta vez” na linguagem de chim¬ 
panzes. O que eu quero dizer e que quando eles acer- 
tam eles recebem uma banana como recompensa pela 
resposta correta. 
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O papel da estatfstica e descobrir quanta 
variacao existe no desempenho e, entao, deci- 
dir quanto disso e sistematico e quanto nao e 
sistematico. 

Em um delineamento de medidas repeti- 
das, as diferencas entre duas condicoes podem 
ser causadas somente por dois fatores: (1) a 
manipulacao que foi realizada nos participantes 
ou (2) qualquer outro fator que possa afetar a 
maneira que uma pessoa executa tarefas repeti- 
damente. Esse ultimo fator e menor comparado 
a influencia da manipulacao experimental. Em 
um delineamento independente, as diferencas 
entre duas condicoes tambem podem ser cau¬ 
sadas por uma de duas coisas: (1) a manipula¬ 
cao que foi conduzida nos participantes ou (2) 
as diferencas entre caracterfsticas das pessoas 
alocadas a cada um dos grupos. Esse ultimo 
fator em geral cria uma consideravel variacao 
aleatoria dentro de cada condicao e entre elas. 
Portanto, o efeito da nossa manipulacao expe¬ 
rimental provavelmente sera mais visfvel no 
delineamento de medidas repetidas do que no 
delineamento entre grupos, ja que no primei- 
ro a variacao nao-sistematica pode ser causada 
somente por diferencas na maneira com que al- 
guem se comporta em oportunidades distintas. 
Nos delineamentos entre grupos, diferencas 
entre habilidades inatas contribuem para a va¬ 
riacao nao-sistematica. Portanto, essa variacao 
de erro sera quase sempre maior do que se o 
mesmo participante fosse utilizado. Quando 
observamos o efeito da nossa manipulacao 
experimental, e sempre contra um contexto 
de “rufdo” causado por diferencas aleatorias e 
incontrolaveis entre nossas condicoes. Em um 
delineamento de medidas repetidas, esse “ru- 
l'do” e mmimo. Desse modo, e mais provavel 
que o efeito do experimento apareca. Isso signi- 
fica que o delineamento de medidas repetidas e 
melhor para detectar efeitos que genuinamente 
existem do que delineamentos independentes. 

7.2.3 Aleatorizagao © 

Tanto nos delineamentos de medidas repe¬ 
tidas quanto nos delineamentos independentes, 
e importante tentar manter a variacao nao-sis¬ 
tematica no menor nfvel possfvel. Dessa forma, 


conseguimos uma medida mais sensfvel da ma¬ 
nipulacao experimental. Geralmente os cientis- 
tas usam a aleatorizagao dos participantes para 
atingir esse objetivo. Muitos testes estatfsticos 
(por exemplo, o teste t) identificam as fontes 
sistematicas e nao-sistematicas da variacao e 
depois as comparam. Essa comparacao permite 
ver se o experimento gerou consideravelmente 
mais variacao do que conseguirfamos se tives- 
semos testado os participantes sem a manipula¬ 
cao experimental. A aleatorizacao e importante 
porque ela elimina a maioria das outras fontes 
de variacao sistematica, o que nos permite ter 
certeza de que qualquer variacao sistematica 
entre condicoes experimentais e devido a ma¬ 
nipulacao da variavel independente. 

Vejamos o delineamento de medidas re¬ 
petidas primeiro. Quando as mesmas pessoas 
participam em mais de uma condicao experi¬ 
mental, isso obviamente viola a nocao de atri- 
buir aleatoriamente pessoas aos grupos. Em- 
bora elas sejam ingenuas durante a primeira 
condicao experimental, na segunda condicao 
as pessoas tern experiencia previa do que e es- 
perado delas. No mmimo, elas estarao familia- 
rizadas com a medida dependente (por exem¬ 
plo, a tarefa que elas estao desenvolvendo). 
As duas fontes mais importantes da variacao 
sistematica nesse tipo de delineamento sao: 

• Efeitos praticos: Os participantes podem 
ter um desempenho diferente na segunda 
condicao por causa da familiaridade com 
a situacao experimental e/ou com as me¬ 
didas usadas. 

• Efeitos de tedio: Os participantes podem 
ter um desempenho diferente na segunda 
condicao porque eles estao cansados ou 
entediados depois de completar a primei¬ 
ra condicao. 

Embora seja impossfvel eliminar com- 
pletamente esses efeitos, podemos assegurar 
que eles nao produzam variacao sistematica 
entre nossas condicoes. Fazemos isso con- 
trabalanqando a ordem em que uma pessoa 
participa de uma condicao. Podemos decidir 
aleatoriamente se um participante faz a condi¬ 
cao 1 antes da condicao 2 ou a 2 antes da 1. 



Descobrindo a Estatistica Usaimdo o SPSS 269 


Retornando ao exemplo do metodo de ensino 
no comego deste capftulo, se os mesmos parti- 
cipantes foram usados em ambas as condigoes, 
podemos achar que a habilidade estatistica foi 
mais alta apos a condigao de estfmulo negati- 
vo. Entretanto, cada estudante experienciou o 
estfmulo negativo apos o positivo e, assim, foi 
para a condicao de estfmulo negativo ja tendo 
um conhecimento melhor de estatistica do que 
quando eles comegaram a condigao de estfmu¬ 
lo positivo. Assim, a melhoria aparente apos o 
estfmulo negativo nao ocorre devido a manipu- 
lagao experimental (isto e, nao e por causa do 
estfmulo negativo), mas sim porque os parti- 
cipantes assistiram a mais aulas de estatistica 
quando eles terminaram a condigao de estfmu¬ 
lo negativo. Para assegurar que o numero de 
aulas de estatistica nao introduza um vies no 
resultado, podemos distribuir a ordem das con- 
digoes de modo aleatorio; assim, metade dos 
estudantes poderia ter o estfmulo negativo pri- 
meiro e a outra metade, o positivo primeiro. 

Um argumento similar pode ser aplicado 
nos delineamentos independentes. Sabemos 
que pessoas diferentes participam em diferen- 
tes condigoes experimentais e que essas pessoas 
irao diferir em muitos sentidos (QI, tempo de 
atengao, etc.). Embora saibamos que esses fa- 
tores (conhecidos como variaveis de confusao) 
contribuam para a variagao entre condigoes, 
precisamos ter certeza de que essas variaveis 
contribuam com a variagao nao-sistematica e 
nao com a variagao sistematica. Para tanto, e 
preciso distribuir aleatoriamente os participan- 
tes a uma condigao experimental particular. Isso 
deve assegurar que as variaveis de confusao es- 
tejam distribufdas igualmente nas condigoes. 

Um bom exemplo sao os efeitos do alcool 
na personalidade. Voce pode dar a um grupo 
de pessoas cinco canecas de cerveja e manter 
um segundo grupo sobrio e, entao, contar em 
quantas brigas cada pessoa entrou. O efeito 
que o alcool tem sobre as pessoas varia mui- 
to devido aos diferentes nfveis de tolerancia: 
pessoas abstemias podem ficar muito embria- 
gadas com uma pequena quantidade enquanto 
alcoolistas precisam consumir grandes quan- 
tidades para que o alcool provoque algum 


efeito. Se voce distribuir um grupo de abste- 
mios numa condigao que consumiu alcool, 
voce pode nao encontrar diferenga entre eles 
e o grupo sobrio (porque os participantes abs- 
temios ficarao inconscientes apos o primeiro 
copo e, assim, nao poderao se envolver em 
briga alguma). Assim, a experiencia previa da 
pessoa com alcool ira criar uma variagao sis¬ 
tematica que nao pode ser dissociada do efeito 
da manipulagao experimental. A melhor ma- 
neira de reduzir isso e distribuir os participan¬ 
tes as condigoes de modo aleatorio. 

7.3 ATRIBUINDO DADOS E 

APRESENTANDO MEDIAS COM 
DIAGRAMAS DE BARRAS DE ERROS 

Como tentei enfati- 
zar no Capftulo 3, e sem- 
pre recomendavel obser- 
var os seus dados com 
graficos antes de come- 
gar a analise. Os graficos 
nos auxiliam a entender 
o que esta acontecendo 
e que tipo de resultados 
esperamos obter. Ja vimos como criar diagra- 
mas de barras de medias na Segao 3.7. Diagra- 
mas de barras sao frequentemente apresentados 
em artigos academicos e sao uma boa maneira 
de resumir dados, mas eles fornecem uma vi- 
sao muito limitada dos dados (por exemplo, os 
diagramas de barras nao indicam o numero de 
escores que contribufram para cada media nem 
nos dizem quanta variagao havia nos escores). 
Os diagramas de barra de erros, abordados na 
Segao 3.7, sao uma maneira melhor de exami- 
nar os dados. Um diagrama de barra de erros 
mostra nao somente a media, mas tambem um 
intervalo de 95% confianga (veja a Segao 1.6.2) 
para a media de cada condigao experimental. 

Voce ja deve estar familiarizado com os 
intervalos de confianga, ja que eles foram vis- 
tos nos Capftulos 1, 5 e 6. Vamos retornar ao 
exemplo dos espermatozoides da Segao 1.6.2, 
no qual tentavamos medir a media do volume 
de espermatozoides (em milhoes) produzida 
pela codorna japonesa. Expliquei que se to- 
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marmos 100 amostras de uma populacao, cal- 
cularmos a media de cada uma e construirmos 
o intervalo de confianga de 95% para cada, 
isso significa que 95 dos 100 intervalos de 
confianga conteriam o valor real da media (o 
valor da populagao). Assim, se um intervalo 
de confianga tern um limite inferior de 2 e um 
limite superior de 16, isso significa que esta- 
mos 95% confiantes que esse intervalo content 
a media da populacao (isto e, a quantidade real 
de espermatozoides produzido pela codorna). 
Portanto, um diagrama de barra de erros mos- 
tra os limites entre os quais pensamos que o 
valor real da media se encontra. 

Em breve voce ira descobrir que o teste 
t funciona com base no principio de que se 
duas amostras sao tiradas da mesma popula¬ 
gao, entao elas devem ter medias bem simi- 
lares. Sabemos do Capftulo 1 que e possfvel 
que quaisquer duas amostras tenham medias 
ligeiramente diferentes (e o erro padrao nos 
informara ate que ponto as medias podem ser 
diferentes). O intervalo de confianga nos diz 
os limites entre os quais a media da populacao 
provavelmente estara inclmda (na verdade, o 
tamanho do intervalo de confianga depende- 
ra do tamanho do erro padrao). No exemplo 
acima, sabemos que a media da populagao 
esta provavelmente entre 2 e 16 milhoes de 
espermatozoides. E se pegarmos uma segunda 


amostra de codornas e encontrarmos um in¬ 
tervalo de confianga variando de 4 a 15? Esse 
intervalo se sobrepoe em boa parte ao da pri- 
meira amostra: 

O fato de que os intervalos de confianca 
se sobrepoem dessa maneira nos diz que essas 
medias poderiam, plausivelmente, vir da mes¬ 
ma populacao: nos dois casos estamos 95% 
confiantes de que os intervalos content o valor 
real da media e ambos os intervalos se sobre¬ 
poem consideravelmente, assim, eles content 
muitos valores similares. E se o intervalo de 
confianca para a nossa segunda amostra va- 
riasse de 18 a 28? Se compararmos isso com 
nossa primeira amostra, temos: 

Agora esses intervalos de confianca nao 
se sobrepoem. Assim, um intervalo de con¬ 
fianga (o qual estamos 95% certos que con¬ 
tent o valor real da media) nos diz que a media 
da populagao e algo entre 2 e 16 ntilhoes, e o 
outro intervalo (o qual tambem estamos 95% 
certos que content o valor real da media) nos 
informa que a media da populacao esta entre 
18 e 28. Isso sugere que ou nossas amostras 
vem de diferentes populacdes ou ambas as 
amostras vem da mesma populagao, mas um 
dos intervalos nao deve conter a media da po¬ 
pulagao. Se utilizarmos intervalos de 95% de 
confianga, saberemos que a segunda possibi- 
lidade e improvavel (isso acontece somente 5 
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vezes em 100 ou 5% das vezes), assim, a pri- 
meira explicagao e a mais provavel. 

OK, voces devem estar pensando: “e se 
as amostras vem de populacdes diferentes?”. 
Bern, se pegamos duas amostras aleatorias de 
pessoas e as testamos em alguma medida (por 
exemplo, medo de livros de estatistica), espe- 
ramos que essas pessoas perten^am a mesma 
populacao. Se as medias das amostras sao tao 
diferentes para sugerir que, de fato, elas vem 
de diferentes popula£oes, conro isso pode 
acontecer? A resposta e que nossa manipula- 
§ao experimental induziu uma di ferenca entre 
as amostras. 

Repetindo, quando uma manipula 5 ao ex¬ 
perimental e bem-sucedida, esperamos que 
nossas amostras venham de diferentes popu¬ 
lates. Se a manipula^ao nao foi um sucesso, 
esperamos que nossas amostras venham da 
mesma popula^o (isto e, as medias das amos¬ 
tras devem ser similares). O intervalo de 95% 
de confian^a nos informa algo sobre o prova¬ 
vel valor da media da populacao. Se tirarmos 
amostras de duas populacoes, esperamos que 
os intervalos de confianpa sejam diferentes 
(para termos certeza de que as amostras sao 
de diferentes populacoes, nao pode haver a so- 
brcposicao dos dois intervalos de confian£a). 
Se tirarmos duas amostras da mesma popula¬ 
te*, esperamos, se nossa medida e confiavel, 
que os intervalos de confianpa sejam nruito 
similares (isto e, eles devem se sobrepor com- 
pletamente). Voce pode estar se perguntando 
onde esse desvio para a teoria dos testes de hi- 
poteses esta nos levando; bem, tern a ver com 
o que eu acabei de dizer que se nossa manipu¬ 
late* experimental tiver sucesso, os intervalos 
de confianpa dos grupos-experimentais nao 
devem se sobrepor. Se as manipulates nao 
tiverem sucesso, os intervalos de confianpa 
irao se sobrepor. Em termos de diagrama de 
barra de erros, veremos que se as barras no 
nosso diagrama de barra de erros nao se 
sobrepoem, isso indica uma dil'erenca sig- 
nificativa entre grupos. Tambem vale a pena 
mencionar, nesse momento, que diagramas de 
barras do SPSS sao adequados somente para 
dados normalmente distribufdos. 


7.3.1 Diagramas de barras de erros para 
delineamentos entre grupos ® 

Quando os dados sao coletados usando 
participantes diferentes em cada grupo, preci- 
samos entrar com os dados usando uma varia- 
vel codificadora (veja a Sepao 2.4.4). Assim, 
o editor de dados tera duas colunas de dados. 
A primeira coluna e uma variavel codificado¬ 
ra ou de codigo (chamada de grupo), a qual, 
quando temos somente dois grupos, ira ob- 
viamente ter dois codigos (por conveniencia, 
sugiro 0 = grupo 1 e 1 = grupo 2). A segunda 
ira ter valores para a variavel dependente. 

Ao longo deste capltulo, uso o mesmo 
conjunto de dados, nao porque sou muito pre- 
guicoso para pensar em diferentes conjuntos 
de dados, mas porque ele me pernrite ilustrar 
varios pontos. O exemplo e se a aracnofobia 
(medo de aranhas) e especlfico a aranhas reais 
ou se figuras de aranhas podem evocar nlveis 
semelhantes de ansiedade. No total, foram usa- 
dos 24 aracnofobicos. Foi pedido a 12 que brin- 
cassem com uma tarantula gigante e cabeluda, 
com grandes presas e um olhar maligno nos 
seus oito olhos. A ansiedade desse grupo foi 
medida. Aos 12 restantes foi apenas mostrado 
figuras da mesma tarantula grande e cabeluda 
e, novamente, sua ansiedade foi medida. Os da¬ 
dos estao no arquivo spiderBG.sav, mas para 
quern quiser praticar a entrada de dados, eles 
estao tambem presentes na Tabela 7.1. Lembre 
que cada linha no editor de dados representa 
um dado diferente de cada participante. Portan- 
to, voce precisa de uma coluna para designar o 
grupo a que eles pertencem e uma segunda co¬ 
luna para representar sua ansiedade. Os dados 
da Tabela 7.1 mostram somente os codigos do 
grupo e nao o rotulo correspondente. Quando 
voce entrar os dados no SPSS, lembre de infor- 
mar ao computador que o codigo 0 representa 
o grupo para o qual foi mostrada a figura e o 
codigo 1 representa o grupo que viu a aranha 
verdadeira (veja a Se^ao 2.4.4). 

Depois que voce entrou com os dados 
(ou acessou o arquivo spiderBG.sav), acesse 
a caixa de dialogo do diagrama da barra de 
erros clicando em Graphs=>Error Bar... 
(Diagramas =>Barra de Erros...). A caixa de 



272 Andy Field 


Tabela7.1 Dados do spiderGB.sav 



dialogo inicial e mostrada na Figura 7.1. Ha 
duas escolhas do grafico do diagrama da barra 
de erros. A primeira e um diagrama de ban'a de 
erro simples (para tra 9 ar nfveis de uma unica 
variavel independente) e a segunda e um dia¬ 
grama do grafico de erros agrupados. 0 grafico 
agrupado pode ser usado quando uma segunda 
variavel independente entre grupos foi medida 
(tal como genera). Nos nos limitaremos a usar 
um diagrama de barra de erro simples. A pro- 
xima escolha e se os dados no diagrama resu- 
mem grupos de casos ou variaveis isoladas. Ha 
uma regra simples aqui: selecione Summaries 
for groups of cases (resumo para grupos de ca¬ 
sos) quando os dados forem coletados usando 
diferentes participantes (como e o caso) e sele¬ 
cione Summaries of separate variables (resu¬ 


mo para variaveis isoladas) quando os dados 
forem coletados usando os mesmos participan¬ 
tes. Quando voce tiver selecionado as op^oes 
apropriadas, clique em ■>*» (Defmir). 



Figura 7.1 Caixa de dialogo inicial para dia- 
gramas de barras de erro. 


Quando voce clicar em (Definir), 
uma nova caixa de dialogo aparece (Figura 
7.2), que permite especificar que variavel ire- 
mos apresentar. Nesse exemplo, temos apenas 
duas variaveis: group (grupo) e anxiety (ansie- 
dade). Assim, usando o mouse, selecione An¬ 
xiety (anxiety ) da lista de variaveis e insira-a no 
espago rotulado de Variable (variavel) clicando 
em 3. Depois, destaque Condition (group) na 
lista de variaveis e transfira-a para o espacjo ro¬ 
tulado de Category Axis (eixo das categorias) 
clicando em 3. Com isso voce pode desenhar 
varias coisas usando esse tipo de grafico, e a 
opgao padrao e apresentar um intervalo de 95% 
de confianca. Este e o tipo de grafico mais util 
entao as opgoes padrao podem ser mantidas. 

O diagrama da barra de erros resultante e 
mostrado na Figura 7.3 e, como voce pode ver, 
ele parece como dois Is. No meio de cada uma 
das duas barras ha um quadrado que representa 
a media de cada grupo. A barra vertical mostra o 
intervalo de confianga em volta daquela media. 
Assim, a partir do grafico desses dados pode- 
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Figura 7.2 Caixa de dialogo principal para diagrama de barras de erro para resumos de grupos 
de casos. 


Barras de erro mostram o 1C de 95,0% para a Media 



Figura 7.3 Diagrama da barra de erros de spiderBG.sav. 


mos ver que quando a figura de uma aranha foi 
usada, o m'vel medio de ansiedade foi 40, e que 
provavelmente a media da popula^ao deve ficar 
entre 34 e 46. Entretanto, quando uma aranha 


verdadeira foi usada, o nfvel medio de ansieda¬ 
de foi 47, e provavelmente a media da popula- 
<jao deve ficar entre 40 e 54. Mais importante, as 
barras de erro se sobrepdem consideravelmente, 
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indicando que e improvavel que essas amostras 
sejam de populates diferentes (portanto, a ma- 
nipulagao experimental nao teve sucesso). Para 
ver se essa ultima afirmagao e verdadeira, voce 
tera de esperar ate a Segao 7.6.3. 

7.3.2 Diagramas de barras de erros 
para delineamentos de medidas 
repetidas © 

Se repetirmos o estudo recem-descrito 
usando os mesmos participantes em cada con- 
digao, podemos produzir um diagrama de bar¬ 
ras de erro identico ao mostrado na Figura 7.3. 
O problema com a criacao de um diagrama de 
barras de erro de dados de medidas repetidas e 
que o SPSS trata os dados como se diferentes 
grupos de participantes tivessem sido usados. 
Para provar que nao estou mentindo, os dados 
para esse estudo estao inclufdos no arquivo 
chamado de spiderRM.sav. Nesse arquivo, os 
valores da ansiedade sao identicos aos dados 
entre grupos. Entretanto, os dados estao orga- 
nizados como se os mesmos participantes ti¬ 
vessem sido usados em cada condigao (ou seja, 
cada participante foi exposto a uma figura de 
uma aranha e sua ansiedade foi medida, e em 
outra ocasiao os mesmos participantes foram 
expostos a aranhas verdadeiras e sua ansieda¬ 
de foi medida novamente). Os dados estao or- 
ganizados de rnodo diferente agora porque os 
mesmos participantes foram usados. No SPSS, 
cada linha do editor de dados representa um 
unico participante, assim, com esse desenho os 
dados sao organizados em duas colunas (uma 
representando a condigao da figura da aranha 
e uma representando a condigao aranha ver¬ 
dadeira). Os dados estao expostos na Tabela 
7.2, e eu recomendo que voce tente inserir es¬ 
ses dados em um novo editor de dados em vez 
de acessar o arquivo em disco. 

Para tracar o grafico da barra de erros 
desses dados, selecione a caixa de dialogo da 
barra de erros clicando em Graphs=>Error 
Bar... (Graficos=>Barra de Erros), e na cai¬ 
xa de dialogo (veja a Figura 7.1), clique em 
|rrsuninMiBMH (Resumos de variaveis se- 
paradas) e, depois, em (Definir). Esse 


Tabela 7.2 Dados do spiderRM.sav 


Sujeito 

Foto (Escore da 
Ansiedade) 

Real (Escore da 
Ansiedade) 

1 

30 

40 

2 

35 

35 

3 

45 

50 

4 

40 

55 

5 

50 

65 

6 

35 

55 

7 

55 

50 

8 

25 

35 

9 

30 

30 

10 

45 

50 

11 

40 

60 

12 

50 

39 


processo mostrara a caixa de dialogo princi¬ 
pal. Uma vez que a caixa de dialogo for ati- 
vada, voce deve selecionar as duas variaveis 
de interesse picture (figura) e real (verdadei¬ 
ra) e clicar em <* . O grafico resultante deve 
ser identico ao que voce obteve para os dados 
entre participantes. Isso e um problema por¬ 
que eu perdi muito tempo Ihe dizendo como 
o delineamento de medidas repetidas elimina 
muito da variancia nao-sistematica dos dados 
e, tragando os dados das medidas repetidas 
dessa maneira, nos ignoramos os componen- 
tes das medidas repetidas dos dados. Loftus & 
Masson (1994) sugerem que uma maneira de 
resolver esse problema e eliminar a variabili- 
dade entre participantes normalizando a media 
dos participantes (isso significa assegurar que 
todos os participantes tenham a mesma media 
entre as condigoes). Para normalizar as medias, 
precisamos usar a fungao compute (calcular) 
do SPSS e executar varios passos (tudo isso foi 
apenas um ardil para voce usar a fungao calcu¬ 
lar). Essa fungao ja foi vista na Segao 3.3.4. 

Na Segao 3.3.4, descobrimos que o coman- 
do compute (calcular) permite executar varias 
fungoes em colunas de dados (isto e, adicionar 
ou multiplicar colunas). Antes de continuar- 
mos, retorne a essa segao e refresque sua me- 
moria sobre as maravilhas dessa fungao! 
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7.3.2.1 Passo 1: Calcular a media para 
cada participate © 

Agora que voce revisou o comando com¬ 
pute (calcular), podemos usa-lo para produzir 
diagramas de barra de erro dentre participantes 
mais precisos. Para comegar, precisamos cal¬ 
cular a ansiedade media de cada participante e, 
assim, usamos a fungao mean (media). Acesse a 
caixa de dialogo compute (calcular) utilizando 
o caminho de menu Transforms Compute... 
(TransformarsCalcular...). Digite a pala- 
vra mean (media) no quadro Target Variable 
(Variavel Alvo) e navegue na lista de fungoes 
ate encontrar uma chamada de MEAN (nu- 
mexpr, numexpr, ...). Destaque essa fungao e 
transfira-a para a area de comando clicando 
em ©. Quando ela for e transferida ira aparecer 
na area de comando como “MEAN(?, ?)”, e os 
pontos de interrogagoes devem ser substituidos 
pelos nomes de variaveis (que podem ser digi- 
tados ou transferidos da lista de variaveis). As¬ 
sim, substitua o primeiro ponto de interrogagao 
pela variavel picture (figura) e o segundo pela 
variavel real (verdadeira). A caixa de dialogo 
completa deve ficar como a da Figura 7.4. 

7.3.2.2 Passo 2: Calcular a media geral © 

A media geral e a media de todos os esco- 
res (independentemente de qual condigao ele se 
origina), assim, para os dados atuais esse valor 
sera a media de todos os 24 escores. Podemos 
calcular isso manualmente (isto e, somando to¬ 


dos os escores e dividindo o resultado por 24); 
entretanto, uma maneira mais facil e usar as 
medias que acabamos de calcular. Essas medias 
representam o escore medio de cada participan¬ 
te e, desse modo, se tomarmos a media desses 
escores medios teremos a media de todos os 
participantes (isto e, a media geral) - ufa, ti- 
nha muitas medias nessa frase! OK, para fazer 
isso podemos usar um pequeno e util disposi- 
tivo chamado de comando descriptives (des- 
critivas) (voce pode tambem usar as fungoes 
Explore (Explorar) ou Frequencies (Frequen¬ 
ces) que vimos no Capitulo 3, mas como eu 
ja falei sobre elas, tentaremos algo diferente). 
Acesse a fungao descriptives (descritivas) uti¬ 
lizando o menu Analyzes Descriptive Statis- 
tics=>Descriptives. ... (Analisar=>Estatistica 
Descritiva=>Descritivas...). Uma caixa de 
dialogo semelhante a da Figura 7.5 devera apa¬ 
recer. O comando descriptives (descritivas) e 
usado para conseguir estatfsticas descritivas ba- 
sicas para variaveis, e clicando ° pl °"‘ (opgoes), 
uma segunda caixa de dialogo e ativada. Se- 
lecione a variavel mean (media) da lista e 
transfira-a para a caixa rotulada de Variable) s) 
(variavel) clicando em 3. Depois, use a caixa 
de dialogo options (opgoes) para especificar 
somente a media (voce pode deixar os demais 
valores como estao porque estamos interessa- 
dos apenas na media). Se voce executar essa 
analise, a safda ira fornecer algumas estatfsti¬ 
cas descritivas autoexplicativas para cada uma 
das tres variaveis (presumindo que voce tenha 



Figura 7.4 Usando a fungao compute (calcular) para determinar a media de duas colunas. 
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Figura 7.5 Caixas de dialogo e saidas para o procedimento estatisticas descritivas. 


selecionado as tres). Voce deve observar que 
temos a media para a condigao “figura da ara- 
nha” e a media para a condigao “aranha real”, 
mas e na variavel final que estamos realmente 
interessados: a media das condigoes “figura da 
aranha” e “aranha real”. A media dessa variavel 
e a media geral, e voce pode ver na tabela resu¬ 
mo que seu valor e 43,50. Nos iremos utilizar a 
media geral em calculos posteriores. 

7.3.2.3 Passo 3: Calcular o fator de 
ajustamento © 

Se voce olhar a variavel rotulada de mean 
(media), devera notar que os valores para cada 
participante sao diferentes, ou seja, algumas 
pessoas tiveram mais ansiedade do que outras 
ao longo das condigoes. O fato de que os es- 
cores da media dos participantes diferem re- 
presenta diferengas individuals entre pessoas 
diferentes (isso representa o fato de que al- 
guns participantes tem mais medo de aranhas 
do que outros). Essas diferengas na ansiedade 
natural a aranhas contaminam os graficos de 
barras de erro, por isso, se nao ajustarmos os 
valores que tragamos, teremos o mesmo grafi- 
co que foi obtido quando o delineamento en¬ 
tre participantes foi usado. Loftus e Masson 
(1994) argumentam que para eliminar essa 
contaminagao, devemos nivelar as medias 
entre os participantes (isto e, ajustar os esco- 
res em cada condigao para que quando calcu- 


larmos a media entre as condigoes ela seja a 
mesma para todos os participantes). Para fazer 
isso, precisamos calcular um fator de ajuste 
subtraindo o escore medio de cada participan¬ 
te da media geral. A fungao compute (calcu¬ 
lar) pode fazer esses calculos para nos. Ative 
a caixa de dialogo compute (calcular), de um 
nome para a variavel-alvo (sugiro ajustar) e 
use o comando (43.5 mean). Esse comando 
ira pegar a media geral (43,5) e subtrair dela o 
nfvel medio de ansiedade de cada participante 
(veja a Figura 7.6). 

Esse processo cria uma nova variavel no 
editor de dados chamada de adjust (ajuste). 
Os escores na coluna adjust representam as 
diferengas medias da ansiedade de cada par¬ 
ticipante e o nfvel medio de ansiedade entre 
todos os participantes. Note que alguns dos 
valores sao positivos e representam os parti¬ 
cipantes menos ansiosos do que a media. Os 
participantes mais ansiosos do que a media 
tem escores ajustados negativos. Podemos 
utilizar agora esses valores ajustados para 
eliminar as diferengas de ansiedade entre os 
participantes. 

7.3.2.4 Passo 4: Criar os valores ajustados 
para cada variavel © 

Ate agora, calculamos a diferenga entre o 
escore medio de cada participante e o escore 
medio de todos os participantes (a media geral). 
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Figura 7.6 Calculando o fator de ajuste. 


Essa difererKja pode ser usada para ajustar os 
escores existentes de cada participante. Primei- 
ro, precisamos ajustar os escores na condigao 
picture of spider (figura da aranha). Mais uma 
vez, podemos usar o comando compute (calcu- 
lar) para fazer o ajuste. Ative a caixa de dialogo 
compute da mesma forma que antes e, entao, de 
o nome para a nova variavel de picture2 (voce 
pode, depois, clicar em T '-^ ia, ‘ I (Tipo e Rotulo) 
e dar a essa variavel um nome tal como “va- 
lores ajustados para a condigao figura”). Ire- 
mos acrescentar o escore de cada participante 
na condicao picture of spider para o seu valor 
ajustado. Selecione a variavel picture (figura) 
e a transfira para a area de comando clicando 
em _J. Depois, clique em _d, selecione a varia¬ 


vel adjust (ajuste) e a transfira para a area de 
comando clicando em _J. A caixa de dialogo 
completa e mostrada na Figura 7.7. Faga o mes- 
mo com a variavel real spider: crie uma varia¬ 
vel chamada de real2 que contem os valores da 
real acrescidos ao valor da coluna adjust. 

As variaveis real2 e picture2 (verdadei- 
ra2 e figura2) representam a ansiedade ex- 
perimentada em cada cond^ao ajustada de 
maneira a eliminar as diferen^as entre os par- 
ticipantes. Se voce nao acredita em mim, use o 
comando compute (calcular) para criar a varia¬ 
vel mean2 (media2) que e a media entre real2 
e picture2 (verdadeira2 e figura2) (como fize- 
mos na Se 5 ao 7.3.2.1). Voce devera verificar 
que o valor nessa coluna e o mesmo para cada 



Figura 7.7 Ajustando os valores da condigao picture of spider. 
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participante demonstrando que a variabilidade 
entre participantes nas medias desapareceu: o 
valor sera 43,50 - a media geral. 

7.3.2.5 Tragar o diagrama de barras de 
erros © 

Tragar o grafico propriamente dito e seme- 
lhante ao cenario entre grupos. Primeiro, acesse 
a caixa de dialogo principal por meio dos menus 
Graphs=>ErrorBar.... (Graficos=>Barra de 
Erros...). Depois, nessa caixa de dialogo (veja 
a Figura 7.1) clique em sumnwa...m** (R e - 
sumo para variaveis separadas) e em ■»*» (De- 
finir). Esse processo ira criar a caixa de dialogo 
principal. Uma vez que a caixa de dialogo for 
ativada, selecione as duas variaveis de interes- 
se (queremos ajustar valores, assim, precisamos 
selecionar real2 e picture2 (verdadeira2 e figu- 
ra2)) e, entao, clique em 2*2 (veja a Figura 7.8). 

O grafico de barras de erro resultante e 
apresentado na Figura 7.9. Voce ira notar que o 
grafico de barras de erro dos valores ajustados 
e um pouco diferente do grafico de barras de 
erro dos valores nao-ajustados (retorne a Fi¬ 
gura 7.3). A primeira coisa a ser notada e que 
as barras de erro nao se sobrepoem. Anterior- 
mente falei que quando as barras de erro nao 
se sobrepoem podemos estar confiantes de que 
nossas amostras nao vieram da mesma popula- 


gao (e, assim, nossa manipulagao experimental 
foi um sucesso). Portanto, a versao do grafico 
de medidas repetidas desses dados indica que 
aranhas verdadeiras podem evocar maiores 
graus de ansiedade (porque a media e alta) do 
que apenas uma a figura de uma aranha. Esse 
exemplo ilustra que conclusoes diferentes po¬ 
dem ser tiradas se os dados foram coletados 
usando os mesmos ou diferentes participantes 
(falarei mais sobre isso na Segao 7.7). 

7.4 TESTANDO DIFERENCAS ENTRE 
MEDIAS: 0 TESTE 7"© 

A forma mais 
simples de fazer 
um experimento e 
manipular uma so 
variavel de duas 
maneiras apenas 
e medir somente 
uma saida. A ma¬ 
nipulagao da va¬ 
riavel independente em geral envolve ter uma 
condigao experimental e um grupo-controle 
(veja Field e Hole, 2003). Alguns exemplos de 
tipos de projetos sao: 

• O filme Panico 2 e mais assustador do que 

o Panico original? Podemos medir os bati- 




Figura 7.8 Caixa de dialogo para tragar um grafico de barras de erro de uma variavel de medidas 
repetidas. 
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Figura 7.9 


?????????????????????????????? 



Grafico da barra de erro dos valores ajustados de spiderRM.sav. 


mentos cardlacos (que indicam ansiedade) 
durante ambos os filmes e compara-los. 

• Escutar musica enquanto voce trabalha 
melhora o seu desempenho? Voce poderia 
pedir para algumas pessoas escreverem 
um artigo (ou livro!) escutando sua mu¬ 
sica favorita e, entao, escreverem outro 
artigo trabalhando em silencio (isso e um 
grupo-controle). Depois, voce poderia 
comparar as notas dos artigos! 

• Escutar a musica favorita do Andy me¬ 
lhora o seu desempenho? Voce poderia 
repetir a estrategia acima, mas, em vez 
de deixar as pessoas trabalharem ouvindo 
sua musica favorita, voce poderia colocar 
algumas das minhas musicas preferidas 
(listadas nos agradecimentos) e ver a qua- 
lidade do seu trabalho despencar! 

O teste t foi projetado para analisar esses 
cenarios. E claro, ha projetos experimentais 
mais complexos e os veremos nos capltulos 
seguintes. Existem dois tipos de testes t e qual 
voce usara ira depender de como a variavel 
independente foi manipulada, se com os mes- 
mos ou diferentes participantes: 


• O teste t para amostras independentes: 

Esse teste e usado quando existem duas 
condigoes experimentais e diferentes par¬ 
ticipantes foram designados para cada 
condigao (isso as vezes e chamado de tes¬ 
te t de medidas independentes ou amos¬ 
tras independentes ). 

• O teste t para amostras dependentes: 

Esse teste e usado quando existem duas 
condigoes experimentais e os mesmos par¬ 
ticipantes tomaram parte em ambas as con¬ 
digoes (esse teste, as vezes, e referido como 
o teste t para amostras emparelhadas). 

7.4.1 Fundamentagao do teste t ® 

Os dois testes tern uma fundamentagao 
semelhante: 

• Duas amostras de dados sao coletadas e 
a media das amostras e calculada. Essas 
medias podem diferir pouco ou muito. 

• Se as amostras vem da mesma populagao, 
esperamos que suas medias sejam pratica- 
mente iguais (veja a Segao 1.6). Embora 
seja possivel que as medias difiram somen- 
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te pelo acaso, grandes diferengas entre as 
medias amostrais nao devem ocorrer com 
frequencia. Sob o que e conhecido como 
hipotese nula, presumimos que a manipu- 
lagao experimental nao tenha efeito nos 
participantes: portanto, esperamos que as 
medias das amostras sejam similares. 

• Comparamos a diferenga entre as medias 
das amostras que coletamos com a diferen- 
5 a entre as medias das amostras que espe¬ 
ramos obter somente pelo acaso. Usamos o 
erro padrao (veja a Segao 1.6) como uma 
medida da variabilidade entre as medias das 
amostras. Se o erro padrao e pequeno, espe¬ 
ramos que a maioria das amostras tenham 
medias similares. Quando o erro padrao e 
grande, esperamos obter grandes diferen¬ 
gas nas medias das amostras somente pelo 
acaso. Se a diferenca entre as amostras que 
coletamos for maior do que esperamos no 
erro padrao, podemos presumir uma de 
duas coisas: 

a) Que as medias das amostras na nossa 
populagao flutuam muito somente por 
acaso e temos, por acaso, coletado duas 
amostras que sao atfpicas da populagao 
de onde foram retiradas. 

b) As duas amostras vem de populates 
diferentes, mas sao tipicas das suas 
respectivas populates originais. Nes- 
se cenario, a diferenga entre amostras 
representa uma diferenga genurna entre 
as amostras (e, assim, a hipotese nula e 
incorreta). 

• A medida que a diferenga observada entre as 
medias das amostras aumenta mais confian- 
te ficamos de que a segunda explicagao seja 
a correta (isto e, que a hipotese nula deva 
ser rejeitada). Se a hipotese nula e incorreta, 
aceitamos o que e denominado de hipotese 
experimental (tambem chamada de hipote- 
se alternativa ou algo semelhante), isto e, 
que as medias das duas amostras diferem 
por causa da manipulagao diferenciada que 
foi imposta a cada uma das amostras. 

Resumindo, calculamos o teste t usando 
a equagao (7.1), mas a forma exata que essa 


equagao tomara vai depender de como os da¬ 
dos foram coletados (isto e, se os mesmos ou 
diferentes participantes foram usados em cada 
condigao experimental). 

diferenga diferenga esperada 
observada entre as medias 
entre as — populacionais 
medias (se a hipotese nula 
amostrais for verdadeira) 

t= - 7 h -C 7 - 1 ) 

estimativa do erro padrao 
da diferenga entre as 
medias de duas amostras 

7.4.2 Suposigoes do teste t © 

Tanto o teste t independente como o de- 
pendente sao testes parametricos baseados na 
distribuigao normal (veja o Capitulo 3). Por¬ 
tanto, e assumido que: 

• Os dados sao de populagoes normalmente 
distribufdas. 

• Os dados sao medidos pelo menos em um 
mvel intervalar. 

O teste t independente, que e usado para 
testar diferentes grupos de pessoas, tambem 
assume que: 

• As variancias populacionais sao iguais 
(homogeneidade da variancia). 

• Os escores sao independentes (porque 
eles vem de diferentes pessoas). 

Essas hipoteses foram explicadas em deta- 
lhes no Capitulo 3, no qual enfatizei a necessi- 
dade de verificar essas suposigoes antes de rea- 
lizar seu teste estatfstico. Nao vou falar sobre 
isso novamente, mas se voce ignorou meu con- 
selho e nao verificou essas suposigoes, entao 
precisa faze-lo agora! O SPSS incorpora, tam¬ 
bem, procedimentos do teste t (por exemplo, o 
teste de Levene - veja a Segao 3.6 - pode ser 
feito ao mesmo tempo em que o teste t ). Vamos 
agora analisar cada um dos testes t. 

7.5 0 TESTE f DEPENDENTE © 

Agora que sabemos como fazer graficos 
de medias, podemos continuar a analisar se di- 
ferengas entre as medias dos grupos sao esta- 
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tisticamente significativas. Se ficarmos com os 
nossos dados de medidas repetidas, podemos 
olhar para o teste t dependente, ou teste t de 
amostras emparelhadas. O teste 1 dependente 
e facil de calcular. Usamos a versao numerica 
da equagao (7.1): 


D ~ M-d 

s d /4n 


(7.2) 


A equagao (7.2) compara a diferenga me¬ 
dia entre nossas amostras (D) com a diferenga 
que devemos esperar encontrar entre as me- 
dias populacionais (// D ) e, entao, leva em con- 
ta o erro padrao das diferengas (S D /fN). Se a 
hipotese nula e verdadeira, esperamos que nao 
haja diferengas entre as medias populacionais 
(isto e, /r D = 0). 


7.5.1 Distribuigdes amostrais e o erro 
padrao ® 

Na equagao (7.1), me referi ao denomina- 
dor da fragao anterior como o erro padrao das 
diferengas. O erro padrao foi apresentado na 
Segao 1.6, e e simplesmente o desvio padrao 
da distribuigao amostral. De uma olhada nessa 
segao agora para refrescar sua memoria sobre 
distributes amostrais e erro padrao. As dis- 
tribuigoes amostrais tem muitas propriedades 
importantes. Para comegar, se a populagao e 
distribulda normalmente, entao o mesmo ocor- 
re com a distribuigao amostral; na verdade, se 
as amostras contem mais do que 50 escores, a 
distribuigao amostral sera sempre distribulda 
normalmente. A media da distribuigao amostral 
e igual a media da populagao - assim, se voce 
calculou a media de todas as medias das amos¬ 
tras, o valor que voce obtem deve ser o mesmo 
da media da populagao. Essa propriedade faz 
sentido porque se uma amostra e representativa 
da populagao, voce deve esperar que sua media 
seja igual a da populagao. Entretanto, algumas 
vezes amostras nao sao representativas e sua 
media difere da media da populagao. Em ge- 
ral, entretanto, a media da amostra estara bem 
proxima da media da populagao e raramente a 
media da amostra sera substancialmente dife- 
rente daquela da populagao. Finalmente, outra 


propriedade da distribuigao amostral e que seu 
desvio padrao e igual ao desvio padrao da po¬ 
pulagao dividido pela raiz quadrada do numero 
de observagoes na amostra. Como mencionei 
anteriormente, esse desvio padrao e conhecido 
como o erro padrao. 

Podemos estender essa ideia olhando para 
as diferengas entre as medias das amostras. 
Se voce fosse tirar varios pares de amostras 
da populagao e calcular suas medias, poderia, 
tambem, calcular a diferenga entre suas me¬ 
dias. Mencionei anteriormente que em geral 
as medias das amostras serao muito similares 
a media da populagao, portanto, a maioria das 
amostras tera medias muito similares. Desse 
modo, na maior parte do tempo, a diferenga 
entre as medias das amostras de uma mes- 
ma populagao sera zero ou proxima de zero. 
Entretanto, algumas vezes uma ou ambas as 
amostras podem ter um media muito afastada 
da media da populagao e, assim, e possfvel ob- 
ter uma grande diferenga entre as medias das 
amostras somente por acaso. Entretanto, isso 
acontece com menos frequencia. 

Na verdade, se tragar essas diferengas 
entre as medias das amostras como um histo- 
grama voce tera, novamente, uma distribuigao 
amostral com todas as propriedades previa- 
mente descritas. O desvio padrao dessa dis¬ 
tribuigao amostral e chamado de erro padrao 
das diferengas. Um erro padrao pequeno indica 
que a maioria dos pares das amostras de uma 
populagao tera medias muito parecidas (isto 
e, a diferenga entre as medias da amostra sera 
frequentemente muito pequena). Um erro pa¬ 
drao grande indica que as medias das amostras 
podem se desviar muito da media da populagao 
e, assim, diferengas entre pares de amostras po¬ 
dem ser bem grandes somente por acaso. 

7.5.2 A equacao do teste t dependente 
explicada CD 

Em um experimento, o escore de uma pes- 
soa na condigao 1 sera diferente do seu escore 
na condigao 2, e essa diferenga pode ser mui¬ 
to grande ou muito pequena. Se calculassemos 
as diferengas entre o escore de cada pessoa em 
cada condigao e somassemos essas diferengas, 




282 Andy Field 




terfamos o total das di¬ 
ferengas. Se, depois, 
dividfssemos essa dife¬ 
renga pelo numero de 
participantes, terfamos 
a diferenga media (ou 
seja, quanto, em media, 
o escore de uma pessoa 
diferiu na condigao 1 
comparado com a condigao 2). Essa diferenga 
media e ( D ) na equagao (7.2) e e um indicador 
da variagao sistematica nos dados (isto e, ele re- 
presenta o efeito experimental). Se tivessemos 
tirado duas amostras aleatorias da populagao (e 
nada feito com essas amostras), as medias po- 
deriam ser diferentes somente por acaso. Como 
ja vimos, o grau no qual duas medias da amos- 
tra provavelmente diferem e determinado pelo 
tamanho do erro padrao das diferengas. Preci- 
samos ter certeza de que a diferenga observada 
entre nossas amostras e devido a manipulagao 
experimental (e nao resultado do acaso). Saber 
somente a diferenga media nao e util porque ela 
depende da escala da medida, portanto, padro- 
nizamos o valor. Uma maneira de padronizar 
a soma da diferenga dos grupos seria dividi-la 
pelo desvio padrao da amostra dessas diferengas 
(veja a Segao 1.4.1). O desvio padrao representa 
a media dos desvios a partir da media, assim, 
o desvio padrao das diferengas entre condigdes 
representa o desvio medio da diferenga das me¬ 
dias. Como tal, o desvio padrao e uma medida 
de quanta variagao existe entre a diferenga dos 
escores dos participantes. Desse modo, o desvio 
padrao dessas diferengas representa a variagao 
nao-sistematica no experimento. 

Esclarecendo, imagine que um alienfgena 
(quando eu estava paralisado de medo de uma 
aranha) me clonou 12 vezes (que os ceus nao 
permitam que existam 12 iguais a mim no pla- 
neta!). Todos os meus clones seriam identicos 
a mim e se comportariam do mesmo modo 
que eu. Portanto, todos nos estarfamos ame- 
drontados com a figura da aranha e terfamos 
um escore de ansiedade de 40. Ao ver aranhas 
verdadeiras, todos molharfamos nossa roupa 
de baixo e terfamos escores de ansiedade de 
50. Lembre-se de que somos clones, portanto, 


temos um comportamento identico. Se voce 
calcular a diferenga entre os escores da nos¬ 
sa ansiedade para a figura e a aranha verda- 
deira, a diferenga sera de 10 pontos para cada 
um de nos. Se voce calcular o desvio padrao 
dessas diferengas o resultado sera 0 (porque 
todos nos temos os mesmos escores, nao ha 
variagao). Como nossos participantes sao os 
mesmos, o desvio padrao e 0; isto e, nao ha 
variagao nao-sistematica. Em outras palavras, 
todas as diferengas em ansiedade resultam da 
observagao de aranhas verdadeiras em vez de 
figuras de aranhas e nenhuma das diferengas 
pode ser explicada por outros fatores (como 
diferengas individuais). 

Embora dividir pelo desvio padrao seja util 
para padronizar a diferenga media entre con- 
digoes, de fato, estamos interessados em saber 
como a diferenga entre as medias das amostras 
se compara com a que esperarfamos obter se 
nao tivessemos feito uma manipulagao experi¬ 
mental. Podemos usar as propriedades da distri¬ 
buigao amostral: em vez de dividir a diferenga 
media entre condigoes pelo desvio padrao das 
diferengas, podemos dividi-la pelo erro padrao 
das diferengas. Dividir pelo erro padrao nao so¬ 
mente padroniza a diferenga media entre con¬ 
digoes, mas tambem informa como a diferenga 
entre as duas medias das amostras se compara 
em magnitude ao que se esperaria somente por 
acaso. Se o erro padrao e grande, grandes dife¬ 
rengas entre amostras sao rnais comuns (porque 
a distribuigao entre as diferengas e mais espa- 
lhada). Ja se o erro padrao e pequeno, grandes 
diferengas entre as medias das amostras sao 
incomuns (porque a distribuigao esta mais con- 
centrada em torno do zero). Portanto, se a dife¬ 
renga media entre nossas amostras e grande e o 
erro padrao das diferengas e pequeno, podemos 
estar confiantes de que a diferenga que obser- 
vamos na nossa amostra nao e um resultado ca¬ 
sual, ou seja, ela deve ter sido provocada pela 
manipulagao experimental. 

Em um mundo perfeito, calcularfamos o 
erro padrao retirando todos os pares possfveis 
de amostras da populagao, descobrindo as di¬ 
ferengas entre suas medias e determinando o 
desvio padrao dessas diferengas. Entretanto, 
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na realidade isso e impossrvel. Portanto, es- 
timamos o erro padrao do desvio padrao das 
diferengas obtido da amostra ( S D ) e do tama- 
nho da amostra (AO- Na Segao 1.6, vimos que 
o erro padrao e simplesmente o desvio padrao 
dividido pela raiz quadrada do tamanho da 
amostra; da mesma forma, o erro padrao das 
diferengas cr ;j e o desvio padrao das diferen¬ 
gas dividido pela raiz quadrada do tamanho da 
amostra: 


Se o erro padrao das diferencas e uma 
medida da variagao nao-sistematica dos dados 
e a soma das diferencas dos escores representa 
a variagao sistematica, deveria ficar claro que 
a estatistica t e simplesmente a razao da va- 
riacao sistematica no experimento para a 
variagao nao-sistematica. Se a manipulagao 
experimental criar qualquer tipo de efeito, a 
variagao sistematica sera bem maior do que a 
variagao nao-sistematica (o t sera, no mmimo, 
maior do que 1). Se a manipulagao experimen¬ 
tal nao for bem-sucedida, a variagao causada 
pelas diferengas individuals sera bem maior 
do que a causada pelo experimento (assim, o 
t sera menor do que 1). Podemos comparar o 


valor obtido para o t com o valor maximo que 
esperamos conseguir somente por acaso numa 
distribuigao t com os mesmos graus de liber- 
dade (esses valores podem ser encontrados no 
Apendice A.2); se o valor que obtivermos ex- 
ceder esse valor crftico, isso reflete um efeito 
da nossa variavel independente. 

7.5.3 0 teste t dependente utilizando o 
SPSS© 

Nos nossos dados sobre aranhas (spi- 
derRM.sav), temos 12 aracnofobicos que fo- 
ram expostos a uma figura de aranha picture 
(figura) e, numa outra ocasiao, foram expostos 
a uma aranha verdadeira real (verdadeira). A 
sua ansiedade foi medida em cada condigao 
(metade dos participantes foi exposta a figura 
antes da aranha verdadeira enquanto a outra 
metade foi exposta a aranha verdadeira primei- 
ro). Ja descrevi como os dados foram organi- 
zados e, assim, podemos seguir adiante e fazer 
o teste propriamente dito. Primeiro precisamos 
acessar a caixa de dialogo principal usando o 
menu Analyze=>CompareMeans=>Paired- 
Samples T Test... (Analisar=>Comparar Me- 
dias=>Teste t para Amostras Emparelhadas...) 
(Figura 7.10). Uma vez ativada a caixa de dia¬ 
logo, selecione duas variaveis da lista (clique 
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Figura 7.10 Caixa de dialogo principal para o teste t pareado. 
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na primeira variavel com o mouse, depois na 
segunda e note que os nomes das variaveis 
aparecem na caixa denominada de Current Se¬ 
lections (Selegoes atuais)) e as transfira para a 
caixa denominada Paired Variables (Variaveis 
Pareadas) clicando em ► . Se voce quiser fa- 
zer varios testes t, pode selecionar outro par de 
variaveis, transferi-las para a lista de variaveis, 
depois selecionar outro par, e assim por dian- 
te. Nesse caso, queremos executar somente um 
teste. Se voce clicar em I (opgoes), apare- 
ce outra caixa de dialogo que oferece a opgao 
de mudar a amplitude do intervalo de confianga 
que e calculado. A configuragao padrao e para 
um intervalo de confianga de 95% e isso e ade- 
quado. Entretanto, se voce quisesse ser mais ri- 
goroso sobre sua analise, poderia ter escolhido 
um intervalo de confianga de 99%, mas assim 
voce correria um risco maior de nao conseguir 
detectar um efeito genulno (um erro do Tipo 
II). Para executar a analise, clique em <* . 

7.5.4 Saidas do teste t dependente © 

A salda resultante produz tres tabelas. A 
salda do SPSS 7.1 mostra uma tabela de es- 
tatlsticas resumo para as duas condigoes ex- 
perimentais. Para cada condigao, sabemos 
a media, o ruimcro de participantes (N) e o 
desvio padrao da amostra. A coluna final in¬ 
forma o erro padrao (veja a Segao 7.5.1), que 
e o desvio padrao da amostra dividido pela 
raiz quadrada do tamanho da amostra (EP = 
sNN), assim, para a condigao da figura EP = 
9,2932/V 12 = 9,2932/3,4641 = 2,68. 


A Salda do SPSS 7.1 tambem mostra a 
correlagao de Pearson entre as duas condi- 
g5es. Quando medidas repetidas sao usadas, 
e posslvel que as condigoes experimentais 
se correlacionem (porque os dados em cada 
condigao vem das mesmas pessoas e, assim, 
pode haver consistencia em suas respostas). O 
SPSS da o valor do r de Pearson e a signifi¬ 
cance bilateral (veja o Capltulo 4). Para esses 
dados, as condigoes experimentais produzem 
um coeficiente de correlagao bem grande (r = 
0,545), mas nao estao correlacionadas de for¬ 
ma significativa porque p > 0,05. 

A Salda do SPSS 7.2 mostra a tabela mais 
importante: aquela que nos diz se a diferenga 
entre as medias das duas condigoes foi grande 
o suficiente para nao ser um resultado ao acaso. 
Primeiro a tabela fornece a diferenga da media 
entre escores (esse valor - D na equagao (7.2) - e 
a diferenga entre os escores medios de cada con¬ 
digao: 40 - 47 = —7). A tabela tambem apresen- 
ta o desvio padrao das diferengas entre as medias 
e, mais importante, o erro padrao das diferengas 
entre os escores dos participantes em cada con¬ 
digao (veja a Segao 7.5.1). A estatlstica teste t 
e calculada dividindo-se a media das diferengas 
pelo erro padrao das diferengas (veja a equagao 
(7.2): t = -7/2,8311 = -2.47). O tamanho do 
t e comparado contra valores conhecidos com 
base nos graus de liberdade. Quando os mesmos 
participantes foram usados, os graus de liber¬ 
dade sao o tamanho da amostra menos 1 (gl = 
N - 1 = 11). O SPSS usa os graus de liberdade 
para calcular a probabilidade exata de que um 
valor de t tao grande quanto o obtido possa ocor- 


Salda do SPSS 7.1 

Paired Sample Statistics Paired Sample Correlations 

(Estatisticas Amostrais Pareadas) (Correlagoes Amostrais Pareadas) 



Mean 

(Media) 

N 

Std. 

Deviation 

(Desvio 

Padrao) 

Std. Error 
Mean (Erro 
Padrao da 
Media) 

Pair 1 Picture of 

40.0000 

12 

9.2932 

2.6827 

(Pari) Spider (Figu¬ 
ra da Aranha) 
Real Spider 
(Aranha Ver- 
dadeira) 

47.0000 

12 

11.0289 

3.1838 



N 

Correlation 

(Correlagao) 

Sig. 

Pair 1 Picture 
(Pari) of Spider 
(Figura da 
Aranha) 

Real Spider 
(Aranha Ver- 
dadeira) 

12 

0.545 

0.067 
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Saida do SPSS 7.2 


Paired Samples Test (Testes Amostrais Pareados) 



Paired Differences (Diferengas pareadas) 





Mean 

(Media) 

Std. 

Deviation 

(Desvio 

Padrao) 

Std. Error 
Mean 
(Erro 

Padrao da 
Media) 

95% co 
interva 
difference 
de confiar 
das diff 

Lower 

(Inferior) 

nfidence 

1 of the 
s (Intervalo 
ga de 95% 
jrengas) 

Upper 

(Superior) 

t 

df 

(gi) 

Sig. 

(2-tailed) 

(Sig. 

bilateral) 

Pair 1 Picture of Spider 
(Pari) (Figura da Ara¬ 
nha) 

Real Spider (Ara¬ 
nha Verdadeira) 

-7.0000 

9.8072 

2.8311 

-13.2312 

-0.7688 

-2.473 

11 

0.031 


rer por acaso. Essa probabilidade esta na coluna 
chamada de Sig. (Significancia). Por padrao, o 
SPSS fornece a probabilidade bilateral, que e a 
probabilidade quando nenhuma previsao foi fei- 
ta sobre a diregao das diferengas entre os grupos. 
Se uma previsao especffica foi feita (por exem- 
plo, podemos prever que a ansiedade sera maior 
quando uma aranha verdadeira e usada), entao 
a probabilidade unilateral deve ser informada, e 
esse valor e obtido dividindo-se a probabilidade 
bilateral por 2. A probabilidade bilateral para os 
dados da aranha e muito baixa (p = 0,031); ela 
nos diz que ha somente uma chance de 3,1% de 
que um valor de t desse tamanho possa ter ocor- 
rido devido ao acaso. Como cientistas sociais, 
aceitamos como estatisticamente significativo 
tudo o que tem menos de 5% de chance de ocor- 
rer por acaso. O fato de o valor de t ser um lui- 
mero negativo nos diz que a condigao 1 (a con- 
dicao picture of spider (figura da aranha)) tem 
uma media menor do que a segunda (a condigao 
real spider (aranha derdadeira)) e, assim, a ara¬ 
nha verdadeira provoca uma ansiedade maior do 
que a da figura. Quando apresentamos um teste 
t, sempre inclm'mos os graus de liberdade (nes- 
se caso, 11), o valor da estatistica re o nfvel no 
qual esse valor e significativo. Portanto, pode¬ 
mos concluir que a exposigao a aranha verdadei¬ 
ra causou mais ansiedade em aracnofobicos do 
que a exposigao a uma figura (t(l 1) = —2,47, p 
< 0,05). Esse resultado foi previsto pelo grafico 
de barra de erros apresentado na Figura 7.9. 


A ultima informacao que essa safda nos 
fornece e um intervalo de confianca de 95% 
para a diferenga media. Imagine que toma- 
mos 100 amostras de uma populagao de di- 
ferentes escores, calculamos suas medias (D) 
e um intervalo de confianga para essa media. 
Em 95 das amostras, o intervalo de confianca 
construldo contem o valor real da diferenga 
media. O intervalo de confianca fornece os li- 
mites dentro dos quais e mais provavel que a 
diferenga real media esteja’. Assim, assumin- 
do que o intervalo de confianga da amostra 
e um dos 95 dos 100 que contem o valor da 
populagao, podemos dizer que a diferenga 
media verdadeira esta entre —13,23 e —0,77. 
A importancia desse intervalo e que ele nao 
contem o zero (isto e, ambos os limites sao 
negativos); isso nos diz que o valor verdadei- 
ro da diferenga media dificilmente sera zero. 
Se comparassemos pares de amostras alea- 
torias de uma populagao, esperarfamos que 
a maioria das diferengas entre as medias das 


3 Vimos na Segao 1.6.2 que esses intervalos representam 
o valor de dois (1,96, precisamente) erros padrao para 
cada lado da media da distriluiicao amostral. Para es¬ 
ses dados em que a diferenga media foi —7 e o erro 
padrao foi de 2,8311, esses limites serao de —7 ± 
(1,96x2,8311). Contudo, em virtude de estarmos utili 
zando a dislribuicao t e nao a dislribuicao normal usa- 
remos um valor crftico da dislnhincao t para calcular os 
intervalos de confianca. Esse valor e (com 11 graus de 
liberdade como nesse exemplo) 2,201 (bilateral), que 
fornece um intervalo de —7 ± (2,201x 2,8311). 
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amostras fosse zero. Esse intervalo nos diz 
que, com base nas nossas duas amostras, e 
pouco provavel que o valor verdadeiro entre 
as medias seja zero. Portanto, podemos estar 
confiantes de que nossas duas amostras nao 
representam amostras aleatorias da mesma 
popula£ao. Em vez disso, elas representam 
amostras de populayoes diferentes induzidas 
pela manipulagao experimental. 

7.5.5 Calculando o tamanho de efeito © 

Embora nosso t estatlstico seja estatis- 
ticamente significativo, isso nao quer dizer 
que nosso efeito seja importante em termos 
praticos. Para descobrir se o efeito e impor¬ 
tante, precisamos usar o que sabemos sobre 
o tamanho de efeito (veja a Segao 1.8.4). Fi- 
carei com o tamanho de efeito r porque ele 
e amplamente entendido, frequentemente 
utilizado e sim, admito, eu realmente gosto 
dele! Converter um valor t em um valor r 6 
muito facil; usamos a seguinte equagao (de 
Rosenthal, 1991, p. 19 e Rosnow e Rosenthal, 
2005, p.328): 


7.5.6 Relatando o teste t dependente © 

Existe uma maneira padrao para rela- 
tar qualquer estatlstica teste: voce declara a 
descoberta com a qual o teste se relaciona, e 
depois relata a estatlstica teste, seus graus de 
liberdade e o valor de probabilidade dessa es¬ 
tatlstica teste. A Associacao Americana de Psi- 
cologia, entre outras associates, recomenda 
que uma estimativa do tamanho de efeito seja 
rotineiramente relatada. Mesmo que os tama- 
nhos de efeito sejam usados esporadicamente, 
quero que voce tenha bons habitos; portanto, 
vamos comegar a pensar em tamanhos de efei¬ 
to agora. Nesse exemplo, a salda do SPSS in- 
dica que o valor do t era —2,47, que os graus 
de liberdade nos quais isso foi baseado era 11 
e que era significativo em p = 0,031. Tambem 
e posslvel ver as medias para cada grupo. Po¬ 
demos escrever isso como: 

/ Na media, os participantes experiencia- 
ram maior ansiedade com aranhas ver- 
dadeiras (M = 47,00, EP = 3,18) do que 
com figuras de aranhas (M = 40,00, EP = 
2,68, r( 11) = —2,43, p < 0,05, r = 0,60). 



Sabemos os valores de t e do gl da salda 
do SPSS, assim, podemos calcular r da seguin¬ 
te maneira: 


2,473 2 


-2,473 z + 11 


6,116 

17,116 

0,60 


Se voce lembrar os nossos pontos de refe¬ 
renda para os tamanhos de efeito, isso repre- 
senta um efeito muito grande (ele esta acima 
de 0,5, o limite para um efeito grande). Por¬ 
tanto, alem de estatisticamente significativo, 
esse efeito tambem e grande; desse modo, re- 
presenta uma descoberta significativa. 


Observe como relatamos as medias em 
cada grupo (e erros padrao) no formato pa¬ 
drao. Para a estatlstica teste, note que usamos 
um t em italico a fim de representar o fato de 
que calculamos uma estatlstica t, e entre pa- 
renteses colocamos os graus de liberdade e 
apresentamos o valor da estatlstica teste. A 
probabilidade pode ser expressa de varias ma- 
neiras: geralmente, relatamos pesquisas em 
um nlvel padrao de significancia (como 0,05), 
conforme fizemos aqui, mas, as vezes, pode¬ 
mos relatar a significancia exata. Finalmente, 
note que relatei o tamanho de efeito no final 
- dificilmente voce vera isso em artigos publi- 
cados, mas deve relata-lo mesmo assim! 

Evite escrever de forma vaga, como: 

X As pessoas estavam mais assustadas com 
as aranhas verdadeiras (t = —2,47) 

Mais assustadas em comparagao a que? 
Onde estao os gll O resultado foi estatistica¬ 
mente significativo? O efeito era importante 
(qual e o tamanho de efeito?) 
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• 0 teste f dependente compara duas medias quando essas medias vieram do 
mesmo grupo de pessoas; por exemplo, se voce tem duas condigoes experi- 
mentais e usou os mesmos participantes em cada condigao. 

• Veja a coluna rotulada de Sig. Se o valor for menor do que 0,05, as medias dos 
dois grupos sao significativamente diferentes. 

• Veja os valores das medias para informar como os grupos diferem. 

• 0 SPSS fornece somente a significance bilateral; se voce quiser a significan¬ 
ce unilateral, basta dividir o valor por 2. 

• Relate a estatistica t, os graus de liberdade e o valor da significance. Relate, 
tambem, as medias e os seus erros padrao correspondentes (ou faga um gra- 
fico de barras de erro). 

• Se voce for corajoso, calcule o tamanho de efeito e relate isso, tambem! 

J 


7.6 0 TESTE T INDEPENDENTS ® 

7.6.1 A equagao do teste t independente 
explicada 0 

O teste t independente e usado em situa- 
coes nas quais existem duas condigoes expe- 
rimentais e participantes diferentes foram usa- 
dos em cada uma. Duas equagoes diferentes 
podem ser utilizadas para calcular a estatistica 
t dependendo se as amostras content ou nao 
um numero igual de participantes. Assim como 
com o teste t dependente, podemos calcular a 
estatistica t usando uma versao numerica da 
equagao (7.1). Com o teste t dependente, po- 
diamos calcular as diferengas entre os pares de 
escores porque eles vinham dos mesmos parti¬ 
cipantes e, assim, diferengas individuals entre 
condigoes eram eliminadas. Dessa maneira, a 
diferenga no escore refletia somente o efeito da 
manipulagao experimental. Ja quando partici¬ 
pantes diferentes representam condigoes dife¬ 
rentes, os pares dos escores irao diferir nao so¬ 
mente por causa da manipulagao experimental, 
mas tambem devido a outras fontes de variagao 
(como diferengas individuals entre a motivagao 
dos participantes, QI, etc.). Se nao podemos 
investigar as diferengas entre as condigoes em 
uma base por participante (comparando pares 
de escores como fizemos com o teste t depen¬ 
dente), devemos fazer comparagoes em bases 
por condigao (olhando para o efeito geral na 
condigao - veja a equagao (7.3)): 


(^i ^2) (M1 M2) ( 73 ) 

Estimativa do erro padrao 

Em vez de observar as diferengas entre 
pares de escores, agora olhamos para as dife¬ 
rengas entre as medias gerais das duas amos¬ 
tras e as comparamos com as diferengas que 
esperamos conseguir entre as medias das duas 
populagoes de onde as amostras vieram. Se a 
hipotese nula e verdadeira, as amostras foram 
retiradas da mesma populagao. Portanto, sob a 
hipotese nula p, 1 = p, 2 e /ij - p 2 = 0. Assim, a 
equagao fica: 


Estimativa do erro padrao 

No teste t dependente, dividimos a diferen¬ 
ga media entre pares de escores pelo erro padrao 
dessas diferengas. No teste t independente, es- 
tamos olhando para as diferengas entre grupos, 
assim, precisamos dividir pelo desvio padrao 
das diferengas entre os grupos. Tambem pode¬ 
mos aplicar a logica das distribuigoes amostrais 
nessa situagao. Imagine que pegamos varios pa¬ 
res de amostras - cada par contendo uma amos- 
tra de cada uma das duas diferentes populagoes 
e comparamos as medias dessas amostras. Do 
que aprendemos sobre distribuigoes amostrais, 
sabemos que a maioria das amostras de uma po¬ 
pulagao tera medias muito parecidas. Portanto, 
se pegarmos varios pares de amostras (de popu- 
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lagoes diferentes), as diferengas entre as medias 
das amostras serao semelhantes entre os pares. 
Entretanto, geralmente a diferenga entre as me¬ 
dias de urn par de amostras ira se desviar por 
um pequeno valor, e, muito ocasionalmente, 
ira desviar por um valor maior. Se pudessemos 
tragar uma distribuigao amostral das diferengas 
entre cada par de medias amostrais que pudes¬ 
semos obter de duas populagoes, descobrirfa- 
mos que ela teria uma distribuigao normal com 
uma media igual a diferenga entre as medias 
das populagoes (/r, - p. 2) A distribuigao amos¬ 
tral nos informaria o quanto podemos esperar 
que as medias de duas (ou mais) amostras di- 
firam. Como anteriormente, o desvio padrao 
da distribuigao amostral (o erro padrao) indica 
quao variaveis serao as diferengas entre as me¬ 
dias das amostras apenas como consequencia 
do acaso. Se o desvio padrao e alto, grandes 
diferengas entre as medias das amostras podem 
ocorrer por acaso; se e pequeno, somente pe- 
quenas diferengas entre as medias das amostras 
sao esperadas. Portanto, faz sentido usar o erro 
padrao da distribuigao amostral para avaliar se 
a diferenga entre as duas medias das amostras e 
estatisticamente significativa ou simplesmente 
fruto do acaso. Especificamente, dividimos as 
diferengas entre as medias das amostras pelo 
desvio padrao da distribuigao amostral. 

Mas como obtemos o desvio padrao da 
distribuigao amostral das diferengas entre me¬ 
dias amostrais? Bern, utilizamos a propriedade 
da soma das variancias, a qual afirma que a 
variancia da diferenga entre duas variaveis in- 
dependentes e igual a soma das suas variancias 
(veja Howell, 2002, Capftulo 7). Essa afirma- 
gao significa que a variancia da distribuigao 
amostral e igual a soma das variancias das duas 
populagoes de onde as amostras foram coleta- 
das. Vimos anteriormente que o erro padrao e 
o desvio padrao da distribuigao amostral de 
uma populagao. Podemos usar os desvios pa¬ 
drao amostrais para calcular o erro padrao da 
distribuigao amostral de cada populagao: 


EP da distribuigao 
amostral da primeira 
populagao 



EP da distribuigao ^ 

amostral da segunda = J— 
populagao yA 

Portanto, lembrando que a variancia e 
simplesmente o desvio padrao ao quadrado, 
podemos calcular a variancia de cada distri¬ 
buigao amostral: 

Variancia da distribuigao 
amostral da primeira 
populagao 

Variancia da distribuigao 
amostral da segunda 
populagao 

A lei da soma das variancias significa 
que para encontrar a variancia da distribuigao 
amostral das diferengas simplesmente soma- 
mos as variancias das distribuigoes amostrais 
das duas populagoes: 

2 2 

Variancia da distribuigao _ Sj_ s 2 
amostral das diferengas N l N 2 



Para encontrar o erro padrao da distribui¬ 
gao amostral das diferengas, tiramos a raiz 
quadrada da variancia (porque a variancia e o 
desvio padrao ao quadrado): 

EP da distribuigao 
amostral das diferengas 



Portanto, a equagao (7.4) se torna a equa¬ 
gao (7.5): 



(7.5) 


A equagao (7.5) e verdadeira somente 
quando os tamanhos da amostra sao iguais. 
Em geral, nas ciencias sociais nao e possfvel 
coletar amostras de mesmo tamanho (porque, 
por exemplo, nem todas as pessoas cornple- 
tam um experimento). Quando queremos 
comparar dois grupos que content numeros 
diferentes de participantes, a equagao (7.5) 
nao e apropriada. Em vez disso, usamos a va- 
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riancia combinada, que leva em conta as dife- 
ren 9 as no tamanho das amostras ponderando 
a variancia de cada amostra. Intuitivamente, 
voce pode perceber que as amostras grandes 
sao melhores do que as pequenas porque elas 
se aproximam mais da populacao; portan- 
to, ponderamos as variancias pelo tamanho 
da amostra na qual ela e baseada (na verda- 
de ponderamos pelos graus de liberdade, que 
sao o tamanho da amostra menos 1). Portanto, 
uma estimativa da variancia combinada e: 

2 _ Or, - 1)^ + ( n 2 - 1)^2 

p ?i x + n 2 — 2 

Isso e simplesmente uma media ponde- 
rada na qual cada variancia e multiplicada 
(ponderada) pelos seus graus de liberdade e, 
depois, dividida pela soma das ponderagdes 
(ou soma dos dois graus de liberdade). A me¬ 
dia da variancia ponderada resultante e, entao, 
substituida na equagao do teste t: 



Assim como o teste t dependente, pode- 
mos comparer o valor obtido de t contra o va¬ 
lor maximo que esperamos conseguir por aca- 
so numa distribui^ao t com os mesmos graus 
de liberdade (esses valores podem ser encon- 
trados no Apendice A.2); se o valor que obte- 
mos exceder esse valor critico, isso reflete um 
efeito na nossa variavel independente. 

A deriva^ao da estatistica t serve apenas 
para fornecer um conhecimento conceitual do 
que estamos fazendo quando executamos um 
teste t no SPSS. Portanto, se voce nao sabe o 
que eu estou falando, nao se preocupe (ape¬ 
nas pense no meu gato: ele tem que ouvir essa 
baboseira o tempo todo!), pois o SPSS sabe 
como faze-lo e isso basta! 

7.6.2 0 teste t independente utilizando o 
SPSS® 

Equa 9 oes sao entediantes, e o SPSS foi in- 
ventado justamente para diminuir nosso con- 


tato com elas. Usando nossos dados da aranha 
novamente (spiderBG.sav), temos 12 aracno- 
fobicos que foram expostos a uma figura de 
aranha e 12 outros aracnofobicos expostos a 
uma tarantula verdadeira (os grupos foram 
codificados usando a variavel group (grupo)). 
Sua ansiedade foi medida em cada cond^ao 
anxiety (ansiedade). Ja descrevi como os da¬ 
dos foram organizados (veja a Se 9 ao 7.3.1), 
assim, podemos seguir direto para o teste pro- 
priamente dito. Primeiro, precisamos acessar 
a caixa de dialogo principal usando o menu 
Analyze=>Compare Means=> Independent 
Samples T Test... (Analisar=?>Comparar 
rnedias=>Teste t para amostras independen- 
tes) (veja a Figura 7.11). Uma vez que a caixa 
de dialogo for ativada, selecione a variavel de¬ 
pendente da lista (clique em anxiety (ansie¬ 
dade)) e transfira-a para a caixa rotulada de 
Test Variable(s) (Variaveis do teste) clicando 
em _J. Se voce quiser executar testes t em 
diversas variaveis dependentes, pode sele- 
cionar outras variaveis dependentes e transfe- 
ri-las para a lista de variaveis. Entretanto, nao 
e recomendavel executar muitos testes (veja o 
Capitulo 8). 

A seguir, precisamos selecionar uma varia¬ 
vel independente (a variavel de grupo). Nesse 
caso, temos que selecionar group (grupo) e 
transferi-lo para a caixa rotulada de Grouping 
Variable (Variavel de agrupamento). Quando 
sua variavel de grupo for selecionada, o botao 
i»i.^c ror . ser ji ativado; clique nele para ativar a 
caixa de dialogo define groups (definir grupos). 
O SPSS precisa saber quais os codigos numeri- 
cos que voce atribuiu para os seus dois grupos 
e ha um espa 90 para voce digitar esses codigos. 
Nesse exemplo, codificamos o grupo que mos- 
tra a figura da aranha como 0 e o grupo que 
mostra a aranha verdadeira como 1, portanto, 
esses sao os codigos que precisamos informar. 
Como alternativa voce pode especificar um 
Ponto de Corte (Cut point)', nesse caso, o SPSS 
ira atribuir todos os casos maiores ou iguais 
aquele valor para um grupo e todos os valores 
abaixo do ponto de corte a um segundo gru- 
po. Esse recurso e util se voce estiver testando 
grupos diferentes de participantes com base em 
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Figura 7.11 Caixas de dialogo para o teste f de duas medias independentes. 


algo como a divisao pela mediana. Voce deve 
classificar as pessoas como aracnofobicas ou 
nao, medindo seu escore num questionario so- 
bre fobia de aranhas e calculando a mediana. 
Qualquer pessoa com um escore acima da me¬ 
diana e classificado como com fobia, e aqueles 
abaixo da mediana, como sem fobia. Em vez 
de registrar todos os seus participantes e criar 
uma variavel codigo, voce simplesmente digita 
o valor da mediana na caixa rotulada de Cut 
Point (Ponto de Corte). Quando voce tiver de- 
finido os grupos, clique em (continual - ) 
para retornar a caixa de dialogo principal. Se 
voce clicar em s 010 "* (Opgoes), outra caixa de 
dialogo aparece e fornece as mesmas opcodes 
oferecidas para o teste t independente. Para 
executar a analise, clique em 011 . 


7.6.3 Saidas do teste t independente CD 

A saida para o teste t independente content 
somente duas tabelas. A primeira tabela (a saida 
do SPSS 7.3) fornece um resumo estatistico 
para as duas cond^des experimentais. Dessa ta¬ 
bela podemos ver que ambos os grupos tinham 
12 participantes (coluna rotulada de N). O grupo 
que viu a figura da aranha teve uma ansiedade 
media de 40 com um desvio padrao de 9,29. 
E mais, o erro padrao daquele grupo (o desvio 
padrao da distribuiijao amostral) e de 2,68 (SE 
= 9,2932/Vl2 = 9,2932/3,46431 = 2,68). Alem 
disso, a tabela indica que o nivel medio de an¬ 
siedade dos participantes aos quais foi mostrada 
uma aranha verdadeira era de 47, com um des¬ 
vio padrao de 11,03 e um erro padrao de 3,18 
(SE= 11,03/V12 = 11,03/3,4641 = 3,18). 


Saida do SPSS 7.3 

Group Statistics (Estatisticas dos grupos) 


Condition (Condigao) 

N 

Mean 

(Media) 

Std. Error 
(Erro Padrao) 

Std. Error Mean (Erro 
Padrao da Media) 

Anxiety Picture of Spider (Figura da 

(Ansiedade) Aranha) 

12 

40.0000 

9.2932 

2.6827 

Real Spider (Aranha Ver¬ 
dadeira) 

12 

47.0000 

11.0289 

3.1838 
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A segunda tabela da saida (Saida do SPSS 
7.4) contem a estatistica teste principal. Note 
que ha duas filas contendo valores para a es¬ 
tatistica teste: um fila e rotulada de Varidn¬ 
cias iguais assumidas, e a outra e rotulada de 
Varidncias iguais nao assumidas. No Capitulo 
3, vimos que os testes parametricos supoem 
que as variancias em grupos-experimentais 
sao aproximadamente iguais. Bern, na verda- 
de existem ajustes que podem ser feitos em si- 
tuag5es nas quais as variancias nao sao iguais. 
As filas da tabela relatam se essa suposigao 
foi quebrada ou nao. Como sabemos se essa 
suposigao foi quebrada ou nao? 

Podemos apenas olhar aos valores da va¬ 
riancia e ver se eles sao similares (por exemplo, 
sabemos que os desvios padrao dos dois gru- 
pos sao 9,29 e 11,03; se elevarmos ao quadra- 
do esses valores teremos variancias de 86,30 e 
121,66). Entretanto, essa medida seria muito 
subjetiva: “Oh, veja, a variancia no grupo 1 e 
somente 3000 vezes maior do que a variancia no 
grupo 2: isso e praticamente igual”. Felizmen- 
te, existe um teste que pode ser feito para ver 


se as variancias sao diferentes o suficiente para 
causar preocupagao. O teste de Levene (veja a 
Segao 3.6) e similar ao teste t, pois ele testa a 
hipotese de que as variancias nos dois grupos 
sao iguais (isto e, a diferenga entre as variancias 
e zero). Portanto, se o teste de Levene e signi- 
ficativo em p < 0,05, podemos concluir que a 
hipotese nula esta incorreta e que as variancias 
sao significativamente diferentes - desse modo, 
a suposigao de homogeneidade das variancias 
foi violada. Se, entretanto, o teste de Levene for 
nao-significativo (isto e, p > 0,05), precisamos 
aceitar a hipotese nula de que a diferenga entre 
as variancias e zero - as variancias sao pratica¬ 
mente iguais e a suposigao e convincente. Para 
esses dados, o teste de Levene nao e signifi- 
cativo (porque p = 0,386, que e maior do que 
0,05); assim, devemos ler a estatistica teste na 
linha chamada de Varidncias iguais assumida. 
Se o teste de Levene tivesse sido significativo, 
terfamos lido a estatistica teste na linha chama¬ 
da de Varidncias iguais nao-assumidas. 

Determinado que a suposigao de homoge¬ 
neidade das variancias esta satisfeita, podemos 


Saida do SPSS 7.4 


Independent Samples Test (Testes Amostrais Independentes) 




Levene's test 
for Equality of 
Variances (Teste 
de Levene de 
Homogeneidade 










de Variancias) 

t-test for Equality of Means (Teste t de Igualdade de Medias) 










95% Confidence 
Intervalo fthe Mean 







Sig. 

Mean 

Difference 

Std. Error 
Difference 

(Intervalo de 
Confianga de 95% 







(2-tailed) 

(Diferenga 

(Erro 
















df 

Sig. 

das 

Padrao da 

Lower 

Upper 



F 

Sig. 

t 

(gi) 

Bilateral 

Medias) 

Diferenga) 

(Inferior) 

(Superior) 

Anxiety 

Equal varian- 

0.782 

0.386 

-1.681 

22 

0.107 

7.0000 

4.1633 

-15.6342 

1.6342 

(Ansie- 

ces assumed 










dade) 

(Supondo 
Variancias Ho- 
mogeneas) 
Equal Varian¬ 
ces Not Assu¬ 
med (Supondo 
Variancias 
Nao-Homoge- 
neas) 



-1.681 

21.385 

0.107 

7.0000 

4.1633 

-15.6486 

1.6486 
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executar o teste t propriamente dito. Sabemos 
a diferenga das medias (X, — X 2 = 40 — 47 = 
—7) e o erro padrao da distribuigao amostral 
das diferengas e calculado utilizando-se o de- 
nominador da equagao (7.5): 



= V(7,19+10,14) 


= Vl7,33 
= 4,16 

A estatfstica t e calculada dividindo a di- 
fercnga media pelo erro padrao da distribui¬ 
gao amostral das diferengas (t = —7/4,16 = 
— 1,68). O valor de t e, entao, avaliado em rela- 
gao ao valor de t que voce pode esperar conse- 
guir ao acaso quando voce tem certos graus de 
liberdade. Para o teste t independente, os graus 
de liberdade sao calculados somando os dois 
tamanhos amostrais e, depois, subtraindo o nu- 
mero de amostras utilizado, nesse caso duas (df 
= N l +N 2 - 2=12+12-2 = 22). O SPSS 
produz o valor exato da significancia de t e 
queremos saber se esse valor e menor ou maior 
do que 0,05. Nesse caso, o valor bilateral dep e 
0,107, o que e maior do que 0,05; portanto, nao 
houve diferenga significativa entre as medias 
dessas duas amostras. Nos termos do experi- 
mento, podemos inferir que aracnofobicos fi- 
cam igualmente ansiosos tanto com a figura da 
aranha quanto com sua prescnca verdadeira. 

A probabilidade bilateral e utilizada quan¬ 
do uma previsao especffica sobre a diregao do 
nosso efeito nao foi feita (veja a Segao 1.8.2). 
Por exemplo, se nao soubermos se a aranha ver¬ 
dadeira ira provocar mais ou menos ansiedade, 
devemos usar o teste bilateral. Entretanto, ge- 
ralmente em pesquisas podemos fazer previsbes 
especificas sobre qual grupo tem a media maior. 
Nesse exemplo, provavelmente terfamos pre- 
visto que a aranha verdadeira provocaria mais 
ansiedade do que a figura e que, consequente- 
mente, a media do grupo verdadeira (real) seria 
maior do que a media do grupo figura (pictu¬ 
re). Nesse caso, podemos usar o teste unilateral 
(para mais detalhes sobre esse assunto, veja a 


Segao 1.8.2, ou Rowntree, 1981, Capltulo 7). 
Alguns estudantes ficam confusos com o fato 
de que o SPSS produz somente a significancia 
bilateral e nao tem uma opgao para produzir a 
significancia unilateral. O motivo e simples: nao 
ha necessidade de uma opgao porque a probabi¬ 
lidade unilateral pode ser averiguada dividindo 
o valor da significancia bilateral por 2. Nesse 
caso, a probabilidade bilateral foi 0,107, portan¬ 
to, a probabilidade unilateral e 0,054 (0,107/2). 
A probabilidade unilateral e maior do que 0,05 
(embora por uma pequena margem), desse 
modo, conclufmos que os aracnofobicos expos- 
tos a aranha verdadeira estavam tao ansiosos 
quanto os aracnofobicos expostos a figura da 
mesma aranha. Esse resultado foi previsto pelo 
grafico de barra de erros da Figura 7.3. 


7.6.4 Calculando o tamanho de efeito (D 

Para descobrir se o nosso efeito e impor- 
tante, podemos usar a mesma equagao da Segao 

7.5.5 a fim de converter a estatfstica t em um va¬ 
lor de r. Sabemos o valor de t e do gl da safda do 
SPSS, podemos calcular r da seguinte maneira: 


1,681 2 


— 1,681+22 


2,826 

24,826 

0,34 


Lembrando dos nossos pontos de referen¬ 
da para os tamanhos de efeito, esse resulta¬ 
do representa um efeito medio (ele esta por 
volta de 0,3, o limite para um efeito medio). 
Portanto, mesmo que o efeito nao tenha sido 
significativo, ele ainda representa um efeito 
substancial. Voce tambem pode notar que o 
efeito encolheu, o que parece um pouco estra- 
nho dado que usamos exatamente os mesmos 
dados (mas veja a Segao 7.7)! 


7.6.5 Relatando o teste t independente © 

As regras que relatei para o teste t depen- 
dente se aplicam quase que totalmente para o 
teste t independente. A safda do SPSS nos in- 
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V. 


• 0 teste t independente compara duas medias quando elas vieram de diferen- 
tes grupos de pessoas; por exemplo, se voce tern duas condigoes experi- 
mentais e usou participantes diferentes em cada condigao. 

• Veja a coluna rotulada de Teste de Levene para a Igualdade de Variancias. Se o 
valor de Sig e menor do que 0,05, a hipotese de homogeneidade da variancia foi 
violada e voce deve olhar somente para a linha na tabela rotulada de Variancias 
iguais nao presumidas. Se o valor de Sig do teste de Levene e maior do que 0,05, 
voce deve olhar para a linha na tabela rotulada de Variancias iguais presumidas. 

• Olhe para a coluna rotulada de Sig\ se o valor e menor do que 0,05, as medias 
dos dois grupos sao significativamente diferentes. 

• Olhe para os valores das medias para saber como os grupos diferem. 

• O SPSS fornece somente o valor de significancia bilateral; se voce quiser a 
significancia unilateral, basta dividir o valor por 2. 

• Relate a estatistica t, os graus de liberdade e o valor de significancia. Indique, 
tambem, as medias e seus erros padrao correspondentes (ou trace um grafi- 
co de barra de erros). 

• Se voce for corajoso, calcule o tamanho de efeito e relate-o tambem! 


forma que o valor de t era - 1,68, que os graus 
de liberdade nos quais isso foi baseado eram 
22, e que nao era significativo para p < 0,05. 
Tambem conseguimos ver as medias para cada 
grupo. Podemos escrever isso como: 

V Em media, os participantes tiveram mais 
ansiedade com a aranha verdadeira (M = 
47,00, EP =3,18) do que com a figura de 
uma aranha (M = 40,00, SE = 2,68). Essa 
diferenga nao foi significativa t(22 ) = 
— 1,68, p > 0,05; entretanto, ela represen- 
tou um tamanho de efeito medio r = 0,34. 

Observe que relatamos as medias em cada 
grupo (e os erros padrao) como anteriormente. 
Para a estatistica teste, tudo e muito parecido 
com antes, exceto que precisei relatar que p 
era maior do que (>) 0,05 em vez de menor do 
que (<). Finalmente, note que comentei sobre 
o tamanho de efeito no final. 

7.7 ENTRE GRUPOS 0UMEDIDAS 
REPETIDAS? © 

Os dois exemplos deste capitulo sao in- 
teressantes porque ilustram a diferenga entre 
os dados coletados usando os mesmos partici¬ 


pantes e usando participantes diferentes. Eles 
utilizam os mesmos escores em cada condi¬ 
gao. Os dois exemplos deste capitulo utili¬ 
zam os mesmos escores nas duas condigoes. 
Quando os dados foram analisados como se 
tivessem vindo dos mesmos participantes, o 
resultado foi uma diferenga significativa entre 
as medias, mas quando eles foram analisados 
como se tivessem vindo de participantes dife¬ 
rentes, nao houve diferenga significativa entre 
as medias dos grupos. Isso pode parecer uma 
descoberta desconcertante - afinal, os nume- 
ros eram identicos em ambos os exemplos. 
O que isso ilustra e o poder relativo do deli- 
neamento das medidas repetidas. Quando os 
mesmos participantes sao usados atraves das 
condigoes, a variancia nao-sistematica (geral- 
mente chamada de variancia do erro) e redu- 
zida drasticamente, facilitando a detecgao de 
qualquer variancia sistematica. Muitos podem 
pensar que a maneira de coletar e irrelevante, 
mas espero ter provado que ela pode fazer a 
diferenga entre detectar uma diferenga ou nao. 
De fato, pesquisadores tern conduzido estudos 
usando os mesmos participantes em condigoes 
experimentais, repetido o estudo utilizando 
participantes diferentes em condigoes expe- 
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rimentais e, entao, usado o metodo de coleta 
de dados como uma variavel independente na 
analise. Em geral, eles tem encontrado que o 
metodo de coleta de dados interage de forma 
significativa com os resultados encontrados 
(veja Erlebacher, 1977). 

7.8 0 TESTE f COMO UM MODELO 
LINEAR GENERALIZADO © 

Pode parecer estranho eu ter escolhido 
representar o tamanho de efeito para os meus 
testes t usando r, o coeficiente de correlagao. 
Voce pode estar pensando: “mas correlates 
mostram relacionamentos, nao diferengas 
entre medias”. Eu costumava pensar assinr 
tambem, ate ler um artigo fantastico de Cohen 
(1968), o qual me fez entender o que eu estava 
perdendo: o complexo e espinhoso mundo da 
estatfstica subitamente ficou muito mais facil 
e simples. Bern, nem tao facil e simples as- 
sim, mas era um bom artigo! O que vou dizer 
podera nao fazer sentido algum para voce ou 
podera ajuda-lo a perceber que todos os pro- 
cedimentos estatfsticos sao basicamente os 
mesmos: eles sao versoes mais ou menos ela- 
boradas do coeficiente de correlate! 

No Capitulo 5, vimos que o teste t foi 
usado para testar se o coeficiente de regres¬ 
sao de uma previsao era igual a 0 . O projeto 
experimental para o qual o teste t dependente 
e usado pode ser conceitualizado como uma 
equate de regressao (afinal, existe uma va¬ 
riavel independente - previsor - e uma varia¬ 
vel dependente - saida). Se quisermos prever 
nossa saida, podemos usar a equagao geral 
que mencionei em varios locais: 

Se quisermos usar um modelo linear, vi¬ 
mos que essa equagao geral se torna a equagao 
(5.2), na qual o modelo e definido pela incli- 
nagao e interseegao da reta. 

Saida, = (Modelo,) + erro, 

A equagao (7.6) e muito similar, em que 
A, e a variavel dependente (saida), b 0 e o in- 
tercepto, e a ponderagao do previsor e G, 
e a variavel independente (previsor). Inclui a 
mesma equagao, mas com algumas das letras 


trocadas em relagao ao que elas representam 
no experimento da aranha (assim, A = ansie- 
dade, G = grupo). Quando executamos um 
experimento com duas condigoes, a variavel 
independente tem somente dois valores (gru¬ 
po 1 e grupo 2). Esses grupos podem ser co- 
dificados de varias maneiras (no exemplo da 
aranha, codificamos o grupo 1 com o valor de 
0 e o grupo 2 com o valor de 1). Essa variavel 
codificada e chamada de dummy (variavel au- 
xiliar) e os valores dessa variavel representam 
grupos de pessoas. Os leitores mais corajosos 
encontraram esta codificagao na Segao 5.10: 

A, = b 0 + bjGj + e, 

Ansiedade, = b 0 + bfirupOj + e, (7.6) 

Usando o exemplo da aranha, sabemos que 
a media da ansiedade do grupo da figura e de 
40 e que a variavel grupo e igual a 0 para essa 
condigao. Veja o que acontece quando a variavel 
grupo e igual a 0 (a condigao figura); a equagao 
(7.6) se torna (se ignorarmos o termo residual): 

40 = b 0 +(b, x 0) 
b 0 = 40 

Portanto, b 0 (o intercepto) e igual a media do 
grupo da figura (isto e, a media do grupo codi- 
ficado de 0). Agora, vamos ver o que acontece 
quando a variavel grupo e igual a 1. Essa con¬ 
digao, a da aranha verdadeira, teve uma media 
da ansiedade (V Vcrd , ltlcira ) de 47. Lembrando que 
acabamos de descobrir que b 0 e igual a media do 
grupo da figura (V Figura ), a equagao (7.6) se toma: 

47 = b 0 +(bj x 1) 

47 = 40 + bj 
b I = Al - 40 

h — X — y 

u 1 yv 'Verdadeira -^Figura 

Portanto, b I representa a diferenga entre as 
medias dos grupos. Como tal, podemos repre¬ 
sentar um experimento de dois grupos como 
uma equagao de regressao na qual o coeficien¬ 
te da variavel independente ( b,) e igual a dife¬ 
renga entre as medias dos grupo e o intercepto 
( b 0 ) e igual a media do grupo codificado como 
0. Na regressao, o teste t 6 usado para averi- 
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guar se o coeficiente de regressao (/?,) e igual 
a 0 , e quando conduzimos um teste t com da¬ 
dos em grupos, testamos se a diferenca entre 
as medias dos grupos e igual a 0 . 

Para provar que nao estou inventando 
isso, use os dados em spiderBG.sav e execute 
uma regressao linear simples utilizando grupo 
como previsor e ansiedade como safda. Gru¬ 
po e codificado usando esquema de codigo de 
0 e 1 e, assim, representa a variavel auxiliar 
descrita acima. A saida do SPSS resultante 
deve conter a tabela do resumo da regressao 
mostrada na Saida 7.5 do SPSS. Primeiro note 
o valor da constante ( b 0 ): e 40, o mesmo da 
media da categoria base (o grupo da figura). 
Agora observe que o valor do coeficiente de 
regressao h, e 7, que e a diferenca entre as 
medias dos dois grupos (47 - 40 = 7). Final- 
mente, se a estatistica t, que testa se b, e signi- 
ficativamente diferente de 0 , e a mesma para 
o teste t independente (veja a Saida 7.4 do 
SPSS), portanto, e o valor da significancia . 4 

Esta segao demonstrou que experimentos 
podem ser representados em termos de mode- 
los lineares; esse conceito e essencial para o 
entendimento dos capitulos seguintes sobre 
modelos lineares generalizados. 


4 Na verdade, o valor da estatistica leo mesmo, mas e 
positivo em vez de negativo. Lembre-se da discussao 
da correlacao ponto bisserial na .Segao 4.5.6: quando 
voce correlaciona uma variavel dicotomica, a diregac 
do coeficiente de correlaqao depende inteiramente de 
que casos sao designados a quais grupos. Portanto, a 
diregao da estatistica t aqui e influenciada pelo grupo 
que selecionamos como a categoria base (a categoria 
codificada de 0). 


7.9 0 QUE FAZER SE OS DADOS 
NAO F0REM N0RMALMENTE 
DISTRIBUID0S? © 

Neste capitulo, vimos que e possivel fazer 
ajustes no teste t quando a hipotese de homo- 
geneidade da variancia e violada; mas e quan¬ 
do voce tiver dados nao normalmente distri- 
buidos? Uma possibilidade e tentar corrigir a 
distribuigao usando uma transformacao (veja o 
Capitulo 3), mas nem sempre funciona. Outra 
solugao util e usar um teste nao-parametrico. 
Esse tipo de teste tern menos hipoteses do que 
seus equivalentes parametricos e, assim, e util 
quando seus dados violam as hipoteses dos 
dados parametricos descritos na Segao 3.2.1. 
Alguns desses testes estao descritos no Capi¬ 
tulo 13.0 equivalente nao-parametrico do tes¬ 
te t dependente e chamado de teste de postos 
com sinais de Wilcoxon (Segao 13.3) e o teste 
t independente tern dois equivalentes nao-para- 
metricos (ambos muito similares) chamados de 
teste da somas dos postos de Wilcoxon e teste 
de Mann-Whitney (Segao 13.2). Recomendo a 
leitura dessas segoes antes de continuar. 

7.10 0 QUE DESC0BRIM0S SOBRE 
ESTATISTICA? © 

Abordamos muitas coisas neste capitulo; 
o que comegou como “um capitulo breve so¬ 
bre comparagao de medias” acabou imenso. 
Essas tendencias perfeccionistas sao uma cruz 
que tenho que carregar! 

Comegamos o capitulo analisando as di- 
ferentes maneiras como os dados podem ser 
coletados e por que pode ser interessante com- 


Saida 7.5 do SPSS Analise de Regressao entre grupos para os dados das aranhas 

Coefficients a (Coeficientes) 




Unstandardized Coefficients 

Standardized Coefficients 





(Coeficientes Nao-Padronizados) 

(Coeficientes Padronizados) 

t 

Sig. 

Model (Modelo) 

B 

Std. Error (Erro Padrao) 

Beta 



1 

Constant (Constante) 

40.000 

2.944 


13.587 

0.000 


Condition (Condigao) 

7.000 

4.163 

0.337 

1.681 

0.107 


a. Variavel dependente: ansiedade. 
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parar duas medias. Abordamos alguns assun- 
tos interessantes, como aleatorizagao. Falei 
sobre graficos de barras de erros, primeiro 
para situacbes em que os dados sao coletados 
usando participantes diferentes e depois quan- 
do os mesmos participantes sao utilizados. 
Aprendemos sobre as caracterfsticas concei- 
tuais gerais do teste t, um teste parametrico 
usado para testar diferengas entre duas me¬ 
dias, e depois vimos os aspectos especfficos 
do teste t dependente (usado quando sua con- 
digao envolve as mesmas pessoas). Expliquei 
como ele e calculado, como faze-lo no SPSS e 
como interpretar os resultados. Descobrimos 
praticamente o mesmo para o teste t indepen- 
dente (usado quando suas condigoes envol- 
vem pessoas diferentes). Depois, falei sobre 
como uma situagao com duas condigoes pode 
ser conceitualizada como um modelo linear 
geral. Finalmente, mencionei os equivalentes 
nao-parametricos do teste t: o teste da soma 
dos postos de Mann-Whitney e Wilcoxon 
(utilizados quando queremos comparar duas 
condigbes em que pessoas diferentes parti- 
ciparam) e o teste dos postos com sinais de 
Wilcoxon (usado quando voce quer comparar 
duas condigoes em que as mesmas pessoas 
participaram). Eles estao descritos no Capitu- 
lo 13. Agora, com licenga, que depois disso 
tudo eu merego uma xfcara de cha Darjeeling* 
e uma barra enorme de chocolate. 

7.11 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• Delineamento entre grupos 

• Delineamento entre participantes 

• Efeitos de tedio 

• Variaveis de confusao 

• Contrabalanceamento 

• Teste t dependente 

• Variavel dependente 

• Grafico de barras de erros 

• Media geral 


* N. de T.: Cha preto muito apreciado na Inglaterra, pro- 
veniente da regiao de Darjeeling, India. 


• Delineamento independente 

• Teste t independente 

• Variavel independente 

• Efeitos praticos 

• Aleatorizagao 

• Delineamento de medidas repetidas 

• Erro padrao das diferengas 

• Lei da soma das variancias 

• Delineamento dentre participantes 


7.12 TAREFAS DO ALEX ESPERTO 


Os dois cenarios seguintes 
foram tirados de Field e Hold 
(2003). Em cada caso, analise 
os dados no SPSS. Respostas 
detalhadas para essas tarefas 
podem ser encontradas em Field e Hold ou re- 
sumidos no site www.artmed.com.br no arqui- 
vo Answers (Chapter 7).pdf. 



• Tarefa 1: Eu simplesmente detesto li- 
vros de “psicologia pop”. Alem de banir 
Freud de todas as livrarias, e minha am- 
bigao livrar o mundo desse desperdfcio de 
arvores. Esses livros nao apenas dao ma 
reputagao a psicologia declarando o obvio 
e ainda cobrando por isso, como tambem 
sao menos agradaveis de olhar do que 
as arvores derrubadas para produzi-los. 
(O que tambem pode ser dito a respeito 
das bobagens que eu produzo em nome 
da educagao, mas nao vamos entrar nes- 
se assunto agora!) Enfim, como parte do 
meu piano de abolir a psicologia popular 
do universo, fiz um pequeno experimento. 
Peguei dois grupos de pessoas que esta- 
vam em relacionamentos e aleatoriamente 
os designei a uma de duas condigoes. Um 
grupo leu o famoso livro de psicologia 
popular Women are from bras and men 
are from penis, e o outro grupo leu Marie 
Claire. Testei apenas 10 pessoas em cada 
um desses grupos e a variavel dependente 
foi uma medida objetiva da sua felicidade 
com seus relacionamentos depois de ler o 
livro. Nao fiz previsao especifica alguma 
sobre qual material de leitura iria aumen- 
tar a felicidade nos relacionamentos. Os 
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dados estao no arquivo Penis.sav; anali- 
se-os com o teste t apropriado. © 

• Tarefa 2: Imagine que a Twaddle & Sons, 
editora de Women are from bras and 
men are from penis, esta chateada com a 
minha crltica de que seu livro e tao util 
quanto um guarda-chuva de papel. Eles 
decidiram me encarregar da tarefa de de- 
linear um experimento proprio no qual 
os participantes leram seu livro e um dos 
meus livros (Field e Hole) em perlodos 
de tempo diferentes. A felicidade nos re- 
lacionamentos foi medida apos a leitura 
de cada livro. Para maximizar as chances 
de encontrar uma diferenga, eles usaram 
uma amostra de 500 participantes em que 
todos os participantes tomaram parte em 
ambas as condigoes (eles leram os dois 
livros). A ordem de leitura dos livros foi 
equilibrada, e houve um espa £0 de seis 
meses entre a leitura de um livro e o ou- 
tro. Eles previram que sua contribuicao 
maravilhosa a psicologia popular iria le- 
var a uma felicidade maior nos relaciona- 


mentos do que a leitura de um livro chato 
e entediante sobre experimentos. Os da¬ 
dos estao em Field&Hole.sav; analise-os 
usando o teste t apropriado. © 

7.13 LEITURAS COMPLEMENTARES 

FIELD, A. P., HOLE, G. How to design and report 
experiments. London: Sage, 2003. Em minha 
opiniao completamente imparcial, esse e um 
livro util para adquirir mais conhecimento 
sobre metodos experimental. 

ROSNOW, R. L.. ROSENTHAL, R. Beginning 
behavioral research: a conceptual primer. 
Englewood Cliffs (NJ): Pearson/Prentice Hall, 
2005. 5 lh ed. 

ROWNTREE, D. Statistics without tears: a primer 
for non-mathematicians. London: Penguin, 
1981. Os Capltulos 4, 5, 6 e 7 contem uma 
otima e abrangente introduqao as ideias de 
distribuiqoes amostrais, teste de hipotese e 
inferencia estatistica. 

WRIGHT, D. B. First steps in statistics. London: 
Sage, 2002. Contem um capltulo claro e 
excelente sobre o teste t (Capltulo 6). 



8 

COMPARANDO VARIAS MEDIAS: 
ANOVA (MLG 1) 


8.1 0 QUE VOCE VAI APRENDER NESTE 
CAPITULO? © 

O capftulo anterior mostrou que podemos 
analisar as diferencas entre duas condicoes ou 
grupos de pessoas. Os testes explorados na- 
quele capftulo sao recursos uteis para a pes- 
quisa em ciencias sociais, contudo, eles estao 
limitados a situacoes em que existem apenas 
dois rn'veis da variavel independente (isto e, 
dois grupos-experimentais). E comum a exe- 
cucao de experimentos em que existem tres, 
quatro ou mesmo cinco nfveis da variavel 
independente; nesses casos, os testes vistos 
no Capftulo 7 nao sao apropriados. No lugar 
deles, uma tecnica denominada analise de 
variancia (ou ANOVA para os fntimos) deve 
ser utilizada. A vantagem da ANOVA e que 
ela pode ser utilizada para analisar situacoes 
nas quais existem diversas variaveis indepen- 
dentes. Nessas situacoes, a ANOVA informa 
como essas variaveis independentes interagem 
umas com as outras e que efeitos essas intera- 
coes apresentam sobre a variavel dependente. 
Este capftulo come£a explicando a teoria da 
ANOVA quando diferentes participantes sao 
usados (ANOVA independente). Depois ire- 
mos aprender a executar uma analise de va¬ 
riancia no SPSS e a interpretar os resultados. 


8.2 A TEORIA POR TRAS DA ANOVA © 
8.2.1 Taxas de erros infladas © 

Antes de explicar como a 
ANOVA funciona, vale a pena 
mencionar por que nao executa- 
mos testes t para comparar todas 
as combinacoes de grupos que 
estao sendo testados. Imagine 
uma situagao em que existem 
tres condicoes experimentais e 
estamos interessados nas diferen- 
gas entre esses tres grupos. Se executassemos 
testes t para cada par de grupos, seria neces- 
sario executar tres testes: um para comparar os 
grupos 1 e 2, outro para comparar os grupos 1 e 
3 e um para comparar os grupos 2 e 3. Se cada 
um desses testes t utilizasse uma significance 
de 5%, a probabilidade de falsamente rejeitar 
a hipotese nula (conhecido como erro do Tipo 
I) para cada teste seria de somente 5%. Dessa 
forma, a probabilidade de nao cometer o erro 
do Tipo I seria 0,95 (95%) para cada teste. Se 
assumirmos que cada teste e independente (ou 
seja, podemos multiplicar as probabilidades), a 
probabilidade total de nao cometermos erro do 
Tipo I seria (0,95) 3 = 0,857, porque a probabi¬ 
lidade de nao cometermos o erro do Tipo I em 
cada teste seria 0,95 e existem tres testes. Dado 
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que a probabilidade de nao cometer o erro do 
Tipo I e 0,857, e possfvel calcular a probabili¬ 
dade de cometer pelo menos um erro do Tipo 
I subtraindo esse resultado de 1 (lembre que a 
probabilidade maxima de algum evento ocor- 
rer e 1). Assim, a probabilidade de pelo menos 
um erro do Tipo I ser cometido el- 0,857 = 
0,143 ou 14,3%. Dessa forma, nesse conjunto 
de testes, a probabilidade de cometer erro do 
Tipo I aumentou de 5% para 14,3%, um valor 
bem maior que o criterio aceito por cientistas 
sociais. Essa taxa de erro envolvendo um con- 
junto de testes conduzidos nos mesmos dados 
experimentais e conhecida como erro de con- 
junto ou erro de experimento. Um experi- 
mento com tres cond^oes e um delineamento 
relativamente simples, assim, o efeito de rea- 
lizar varios testes nao e severo. Se aumentas- 
semos o numero de cond^oes experimentais 
de tres para cinco (apenas acrescentando mais 
dois grupos), o numero de testes t necessario 
aumentaria para 10. 1 2 O valor do erro de con- 
junto poderia ser calculado utilizando a equa- 
cao geral (8.1), na qual n e o numero de tes¬ 
tes executados com os dados. Com 10 testes 
executados, o valor do erro de conjunto seria 
0,40 (1 - 0,95 10 = 0,40), o que significa que 
teriamos uma probabilidade de 40% de ter co¬ 
metido pelo menos um erro do Tipo I. Por essa 
razao, utilizamos a ANOVA em vez de realizar 
varios testes t: 

Erro de conjunto = 1 - (0,95)" (8.1) 


1 Essas compara^oes sao: 1 vs. 2, 1 vs. 3, vs. 4, 1 vs. 5, 

2 vs. 3, 2 vs. 4, 2 vs. 5, 3 vs. 4. 3 vs. 5 e 4 vs. 5. O nu¬ 
mero de testes necessario e determinado utilizando a 
seguinte equa$ao: 

k\ 

Numero de comparacoes C = - 

2(k — 2)\ 

onde ke o numero de condicoes experimentais. O si'm- 
bolo ! e denominado fatorial e significa que voce deve 
multiplicar o valor que vem antes do simbolo por todos 
os numeros inteiros entre ele (inclusive) e zero (exclu¬ 
sive) (assim, 5! = 5x4x3x2x 1 = 120). Dessa forma, 
com cinco condicoes encontraremos que: 


Quando executamos tes¬ 
tes t, testamos a hipotese de 
que as duas populates de 
onde as amostras foram re- 
tiradas apresentam a mesma 
media. Da mesma maneira, a 
ANOVA nos informa se tres 
ou mais medias populacio- 
nais sao iguais, assim, ela 
testa a hipotese de que as medias de todas as 
condicoes sao iguais. 

Uma ANOVA produz uma estatistica F ou 
razao F que e semelhante a estatistica t pois ela 
compara a variancia sistematica nos dados com 
a variancia nao-sistematica. Contudo a ANOVA 
e um teste abrangente (omnibus), o que significa 
que ela testa um efeito experimental de forma 
global: assim, existem coisas que a ANOVA nao 
nos informa. Embora a ANOVA nos informe se 
a manipulagao experimental teve sucesso, ela 
nao fornece informacoes especlficas sobre quais 
grupos foram afetados. Supondo que um expe¬ 
rimento tenha sido realizado com tres grupos 
diferentes, a razao F simplesmente nos informa 
que as medias das tres populates de onde os 
grupos foram retirados sao diferentes (isto e, 
ni! = m 2 = m 3 nao e verdadeiro). Contudo, as 
medias podem diferir de varias maneiras. A pri- 
meira possibilidade e que as tres medias sejam 
significativamente diferentes (m t ^ m 2 ^ m 3 ). 
Uma segunda possibilidade e que as medias das 
populacbes 1 e 2 nao sejam diferentes mas te- 
nham uma diferenga significativa em relagao a 
terceira populapao ( 1 ^ = m 2 m 3 ). Outra pos¬ 
sibilidade e que as populates 2 e 3 nao difiram 
mas sejam significativamente diferente da media 
da populagao 1 (mj ^ m 2 = m 3 ). Finalmente os 
grupos 1 e 3 podem indicar medias semelhantes 
mas o grupo 2 indica diferenga significativa das 
populates 1 e 3 (m 3 = m 3 ^ m 2 ). Assim, a ra¬ 
zao F informa apenas que a manipula 5 ao expe¬ 
rimental tern algum efeito, mas nao nos informa 
especificamente qual e esse efeito. 

8.2.2 ANOVA como regressao © 

Muitos cientistas sociais nao se dao con- 
ta de que a ANOVA e a analise de regressao 
sao conceitualmente o mesmo procedimento. 
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O motivo e principalmente historico, pois 
dois ramos distintos da metodologia se de- 
senvolveram nas ciencias sociais: a pesquisa 
correlacional e a experimental. Pesquisadores 
interessados em experimentos controlados 
adotaram a ANOVA como tecnica estatfsti- 
ca basica, ao passo que os interessados em 
determinar relacionamentos reais adotaram 
a regressao multipla. Como os cientistas sao 
pessoas maduras, inteligentes e racionais, 
nenhum dos grupos tentou difamar o outro 
defendendo que a sua escolha metodologica 
foi melhor. Com essa divisao, a metodologia 
tornou-se uma divergencia entre os metodos 
estatfsticos adotados pelos dois campos opos- 
tos (Crombach, 1957, documenta essa divisao 
em um otimo artigo). Essa divisao vingou por 
muitas decadas, tanto que ainda hoje os es- 
tudantes aprendem regressao e ANOVA em 
contextos bem diferentes, e muitos livros di- 
daticos ensinam ANOVA de uma forma intei- 
ramente distinta da regressao. 

Embora muitas pessoas mais inteligentes 
do que eu tenham tentado restabelecer essa 
conexao entre ANOVA e analise de regressao 
(como o grande Jacob Cohen, 1968), estou 
empolgado em escrever o meu - breve e tolo - 
esclarecimento (e colocar a bola em jogo nas 
Segoes 5.10 e 7.8). Existem varias boas razoes 
para pensar que a ANOVA deve ser ensinada 
no contexto da regressao. Primeiro, ela forne- 
ce um contexto familiar: desperdicei varias 
arvores explicando a regressao, entao por que 
nao utilizar essa base de conhecimento para 
explicar o novo conceito (tornando-o mais fa- 
cil de compreender). Segundo, o metodo tradi- 
cional de ensinar a ANOVA (conhecido como 
metodo da razao das variancias) e bom para 
delineamentos simples, mas problematico em 
situacbes mais complexas (como na analise 
de covariancia). O modelo de regressao se es- 
tende de uma forma logica para esses deline¬ 
amentos mais complexos sem que seja neces- 
sario ficar atolado na matematica. Finalmente, 
o metodo das razoes das variancias e extre- 
mamente nao-manejavel em circunstancias 
incomuns, como quando voce tem amostras 


de tamanhos diferentes. 2 O metodo da regres¬ 
sao torna essas situagoes muito mais simples. 
Embora essas razoes sejam boas o suficiente, 
a verdade e que o SPSS tambem abandonou 
o metodo da razao das variancias e passou a 
utilizar apenas o modelo de regressao (co¬ 
nhecido como modelo linear generalizado ou 
MLG). O resultado final das duas abordagens 
para a ANOVA e o mesmo e muitos textos ja 
detalham a abordagem da razao das variancias 
(recomendo o Howell, 2002). Assim faz senti- 
do utilizar a abordagem da regressao. 

A ANOVA e uma forma de comparar a 
razao entre a variancia sistematica e a nao sis- 
tematica em um estudo experimental. A razao 
dessas variancias e conhecida como estatfsti- 
ca F ou razao F. Quem leu o Capftulo 5 deve 
lembrar a razao F (veja a Segao 5.2.3) porque 
ela foi utilizada para avaliar quao bem um 
modelo de regressao pode prever uma safda 
comparada ao erro dentro do proprio modelo. 
Se voce nao leu o Capftulo 5 (provavelmente 
nao!), de uma olhada antes de ir adiante (deve 
demorar apenas duas semanas para le-lo). A 
razao F na ANOVA e exatamente a mesma da 
regressao, exceto que um modelo de regressao 
content somente previsores categoricos (isto 
e, variaveis de agrupamento). Desse modo, as¬ 
sim como o teste t pode ser representado por 
uma equagao de regressao linear (veja a Secao 
7.8), a ANOVA pode ser representada por uma 
equagao de regressao multipla na qual o nli¬ 
me ro de previsores e um a menos do que o nli¬ 
me ro de categorias da variavel independente. 

Vejamos um exemplo. Havia muita contro- 
versia sobre o medicamento Viagra quando es- 
crevi a primeira edigao deste livro. Agora existe 
bem menos polemica, mas ela foi substitufda 
por milhares de spams sobre o assunto (pelos 
quais eu serei grato, sem duvida, daqui a 20 
anos); assim, irei continual' com esse exemplo. 
O Viagra e um estimulante sexual (para tratar a 
impotencia) utilizado com a crenga de que ele 
fara do sujeito um amante melhor (estranha- 


2 Dito isso, vale tentar obter amostras de mesmo tama- 
nho nas diferentes siluacdcs. pois delineamentos des- 
balanceados provocam complicacoes estatfsticas (veja 
a SeQao 8.2.9). 
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mente, varios jornalistas estao usando o pro- 
duto em nome do “jornalismo investigativo”... 
hummm!). Suponha que vamos testar essa cren- 
5 a em tres grupos de participantes e administrar 
a um grupo um placebo (como uma pflula de 
agucar), a outro grupo uma dose baixa de Viagra 
e ao terceiro grupo uma dose alta. A variavel de- 
pendente e uma medida objetiva da libido (ape- 
nas relatarei que ela foi mensurada ao longo de 
uma semana - o resto deixo para a imaginagao 
de cada um). Os dados estao no arquivo Viagra, 
sav (descrito em detalhes posteriormente nesse 
capltulo) e sao apresentados na Tabela 8.1. 

Se quisermos prever os nlveis da libido a 
partir dos diferentes nlveis de Viagra, pode- 
mos utilizar a famosa equagao geral: 

Saida,- = (Modelo,) + erro, 

Se voce quiser utilizar um modelo linear, 
vimos na Segao 7.8 que quando existem somen- 
te dois grupos, podemos substituir o “modelo” 
nessa equagao com uma equagao de regressao 
linear como uma dummy (variavel auxiliar) para 
descrever dois grupos-experimentais. Essa va¬ 
riavel auxiliar e uma variavel categorica com 
dois codigos numericos (0 para um grupo e 1 
para o outro). Com tres grupos, no entanto, po¬ 
demos estender essa ideia e utilizar um modelo 
e regressao multipla com duas variaveis auxilia- 
res. De fato, como regra geral, podemos esten¬ 
der um modelo para qualquer numero de grupos 
e o numero de variaveis auxiliares necessarias 
sera um a menos que o numero de categorias 

Tabela 8.1 Dados em Viagra.sav 



da variavel independente. No caso de dois gru¬ 
pos, uma categoria foi considerada como base 
(lembre que na Segao 7.8 escolhemos a condi- 
gao foto como uma base) e essa categoria foi 
codiftcado como 0. Quando existem tres catego¬ 
rias tambem precisamos de uma categoria base, 
e deve ser escolhida a condigao com a qual se 
pretende comparar os demais grupos. Em geral, 
essa categoria sera o grupo-controle. Nos expe- 
rimentos sociais bem-conduzidos quase sempre 
ha um grupo de participantes que agiu como 
grupo-base para as demais categorias. Esse gru¬ 
po atua como uma referenda ou categoria base, 
embora o grupo que e escolhido dependa das 
hipoteses que se pretende testar. Em delinea- 
mentos nao-balanceados (os grupos nao sao do 
mesmo tamanho), e importante que a categoria 
base contenha muitos casos para assegurar que 
as estimativas dos coeficientes de regressao se- 
jam confiaveis. No exemplo do Viagra, podemos 
usar o grupo-placebo como categoria base por- 
que esse e o grupo-controle. Estamos interessa- 
dos em comparar tanto o grupo com altas doses 
quanto o com doses baixas com o grupo que nao 
tomou Viagra. Se o grupo-placebo e a categoria 
base, as duas variaveis auxiliares que precisa¬ 
mos criar representam as duas outras condigoes, 
assim, devemos ter uma variavel auxiliar deno- 
minada Alta e outra Baixa. A equagao resultante 
e apresentada em ( 8 . 2 ): 

Libido, = b Q + 7> 2 Alta,- + Baixa, + e,- (8.2) 

Na equagao (8.2), a libido de uma pessoa 
pode ser prevista a partir do conhecimento do 
codigo do seu grupo (isto e, o codigo das va¬ 
riaveis auxiliares Alta e Baixa) e pelo intercep- 
to ( b 0 ) do modelo. As variaveis auxiliares na 
equagao ( 8 . 2 ) podem ser codificadas de varias 
formas, mas a mais simples e utilizar uma tec- 
nica semelhante a do teste t. A categoria base e 
sempre codificada como 0. Se um participante 
recebeu uma alta dose de Viagra, ele e codifi- 
cado como 1 para a variavel auxiliar e 0 para 
todas as outras variaveis. Se um participante 
recebeu uma dose baixa de Viagra, ele sera co- 
dificado como o valor 1 para a variavel auxiliar 
baixa e como 0 para as demais (esse e o mesmo 
esquema utilizado na Segao 5.10). Utilizando 
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Tabela 8.2 Variaveis auxiliares para os tres 
grupos do projeto experimental 



Variavel 

Variavel 


auxiliar 1 

auxiliar 2 

Grupo 

alta y 

baixa y 

Placebo 

0 

0 

Dose baixa de 
Viagra 

0 

1 

Dose alta de 
Viagra 

1 

0 


esse esquema de codificagao, podemos expres- 
sar cada grupo combinando os codigos das 
duas variaveis auxiliares (veja a Tabela 8.2). 

Grupo-placebo: vamos examinar o modelo 
para o grupo-placebo. No grupo-placebo, as va¬ 
riaveis auxiliares dose alta e dose baixa sao co- 
dificadas como 0. Alem disso, se ignorarmos o 
termo erro (e ; ), a equagao de regressao se torna: 

Libido; = b Q + (b 2 x 0) + (b { x 0) 

Libido, = b 0 

-^Placebo = ^0 

Essa e uma situacao em que os grupos de 
dose alta e baixa foram ambos excluidos (eles 
foram codificados como 0). Queremos prever 
o nivel de libido quando ambas as doses de 
Viagra forem ignoradas, desse modo, o valor 
previsto sera a media do grupo-placebo (por- 
que esse e o unico grupo inclufdo no modelo). 
Assim, o intercepto do modelo de regressao, 
b 0 , e sempre a media da categoria base (nesse 
caso, a media do grupo-placebo). 

Grupo de alta dosagem: se examinarmos 
o grupo de alta dosagem, a variavel auxiliar 
alta sera codificada como lea variavel auxiliar 
baixa, como 0. Se substituirmos os valores des¬ 
ses codigos na equagao (8.2), o modelo fica: 

Libido, = b 0 + (b 2 x 1) + (b { x 0) 

Libido,- = b Q + b 2 

Ja sabemos que b 0 e a media do grupo-place¬ 
bo. Se estivermos somente interessados no gru¬ 
po de alta dosagem, entao o modelo deve prever 
que o valor da libido para um dado participante 
iguale a media do grupo de alta dosagem. Dada 
essa informagao, a equagao torna-se: 


Libido, = b 0 + b 2 

-^Alla -^Placebo V b 2 
^2 -^Alta -^Placebo 

Assim, b 2 representa a diferenga entre 
as medias dos grupos de alta dosagem e o 
grupo-placebo. 

Grupo de baixa dosagem: finalmente, 
se olharmos para o modelo quando uma dose 
baixa de Viagra for administrada, a variavel 
auxiliar sera codificada como 1 (e o grupo de 
alta dosagem como 0). Assim, a equagao de 
regressao se torna: 

Libido,- = b 0 + (b 2 x 0) + (b { x 1) 
Libido, = b Q J r b i 

Sabemos que o intercepto e igual a media 
da categoria-base e que, para o grupo de baixa 
dosagem, o valor previsto deve ser a media da 
libido para o de baixa dosagem. Dessa forma, 
o modelo pode ser reduzido para: 

Libido, = b 0 + b { 

-^Alla -^Placebo V 

^Baixa -^Placebo 

Assim, representa a diferenga entre as 
medias dos grupos de baixa dosagem e o gru¬ 
po-placebo. Essa forma de codificagao com 
variaveis auxiliares e a mais simples, mas, 
como veremos mais tarde, existem outras 
formas em que as variaveis podem ser codifi- 
cadas para testar hipoteses especfficas. Esses 
esquemas de codificagao alternatives sao de- 
nominados contrastes (veja a Segao 8.2.10.2). 
O objetivo dos contrastes e codificar as varia¬ 
veis auxiliares de tal forma que os valores-b 
representem diferengas entre os grupos que 
estamos interessados em testar. 

Para ilustrar exatamente o que esta aconte- 
cendo, criei um arquivo denominado dummy, 
sav na pasta do Chapter 8 dispom'vel no site 
www.artmed.com.br. Esse arquivo content os 
dados do Viagra, mas com duas variaveis au¬ 
xiliares adicionais (dummyl e dummy2) que 
especificam a que grupo cada dado pertence 
(como na Tabela 8.2). Acesse esse arquivo 
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e execute uma analise de regressao multipla 
utilizando libido como safda e dummyl e 
dummy2 como variaveis previsoras. Se voce 
nao sabe como executar uma regressao, leia 
o Capftulo 5 novamente (observe que os ca- 
pftulos estao ordenados por um motivo!). A 
analise resultante e mostrada na Saida 8.1 do 
SPSS. E recomendavel relembrar as medias 
dos grupos a partir da Tabela 8.1. Note que a 
constante e igual a media da categoria-base 
(o grupo-placebo). O coeficiente de regressao 
para a primeira variavel auxiliar (b 2 ) e igual a 
diferenca entre as medias dos grupos de alta 
dosagem e o grupo-placebo (5,0 - 2,2 = 2,8). 
Finalmente, o coeficiente de regressao para 
a segunda variavel auxiliar (bj) e igual a di- 
ferenca entre as medias dos grupos de baixa 
dosagem e o grupo-placebo (3,2 - 2,2) = 1). 
Essa analise demonstra como o modelo de re¬ 
gressao representa a situa 9 ao dos tres grupos. 
Podemos ver a partir dos valores da significan- 
cia dos testes t que a diferenca entre o grupo 
de alta dosagem e o grupo-placebo (b 2 ) e sig- 
nificativa porque p < 0,05. A difere 119 a entre 
o grupo de baixa dosagem e o grupo-placebo 
nao e, entretanto, significativa (p = 0,282). 

Um experimento para quatro grupos pode 
ser descrito estendendo o cenario dos tres 
grupos. Mencionei anteriormente que voce 
sempre ira precisar de uma variavel auxiliar 
a menos do que o nurnero de grupos no ex¬ 
perimento: assim, esse modelo requer tres ou 
mais variaveis. Como antes, voce precisa es- 
pecificar uma categoria que sera a categoria 
base (o grupo-controle). Essa categoria base 


deve ser codificada como 0 para todas as va¬ 
riaveis auxiliares. As tres condones restantes 
terao um codigo de 1 para a variavel auxiliar 
que descreve a condi^ao e o codigo de 0 para 
as outras duas variaveis auxiliares. A Tabela 

8.3 ilustra como codificar esse esquema. 

8.2.3 A logica da razao F © 

No Capftulo 5, aprendemos um pouco so- 
bre a razao F e como calcula-la. Recapitulan- 
do, aprendemos que a razao F e utilizada para 
testar o ajustamento global de um modelo de 
regressao a um conjunto de dados. Recem ex- 
pliquei que a ANOVA pode ser representada 
como uma equa§ao de regressao, e isso deve 
ajuda-lo a entender o que a razao F informa so- 
bre os dados. A Figura 8.1 mostra os dados do 
Viagra na forma grafica (incluindo as medias 
dos grupos, a media geral e a diferenca entre 
cada caso e a media do grupo). Nesse exem- 
plo, existem tres grupos; dessa forma, quere- 
mos testar a hipotese de que as medias dos tres 
grupos sao diferentes (assim, a hipotese nula 


Tabela 8.3 Variaveis auxiliares para um 
projeto de quatro grupos 


Grupo 

Variavel 
auxiliar 1 

Variavel 
auxiliar 2 

Variavel 
auxiliar 3 

Grupo 1 

1 

0 

0 

Grupo 2 

0 

1 

0 

Grupo 3 

0 

0 

1 

Grupo 4 
(base) 

0 

0 

0 


Saida do SPSS 8.1 


Coefficients a (Coeficientes) 




Unstandardized Coefficients 
(Coeficientes nao-padronizados) 

Standardized Coefficients 
(Coeficientes padronizados) 

t 

Sig. 


Model (Modelo) 

B 

Std. Error 
(Erro padrao) 

Beta 



1 

(Constant) (Constante) 

2.200 

0.627 


3.508 

0.004 


Dummy Variable 1 (Variavel 
auxiliar 1) 

2.800 

0.887 

0.773 

3.157 

0.008 


Dummy Variable 2 (Variavel 
auxiliar 2) 

1.000 

0.887 

0.276 

1.127 

0.282 


a. Dependent Variable: Libido (Variavel dependente: Libido) 
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Figura 8.1 Dados do Viagra no formato grafico. As linhas pontilhadas representam a libido me¬ 
dia de cada grupo. As diferentes formas representam a libido de participantes individuals (formas 
diferentes indicam grupos-experimentais diferentes). A linha cheia horizontal e a libido media de 
todos os participantes. 



Placebo Alta dosagem 


e que as medias dos grupos sao iguais). Se as 
medias dos grupos sao todas iguais, nao espe- 
ramos que o grupo-placebo seja diferente dos 
grupos de alta e baixa dosagem e nao espera- 
mos que o grupo de baixa dosagem difira do 
grupo de alta dosagem. Portanto, no diagrama, 
as tres linhas pontilhadas estarao na mesma 
posigao horizontal (a posigao exata sera a me¬ 
dia geral). E possfvel ver a partir do diagrama 
que as medias dos grupos sao de fato diferen¬ 
tes porque as linhas pontilhadas (as medias dos 
grupos) estao em posigoes horizontais distin- 
tas. Acabamos de descobrir que no modelo de 
regressao, b 2 representa a ditcrenca entre as 
medias dos grupos-placebo e alta dosagem e 
que b! representa a diferenca nas medias dos 
grupos-placebo e o de baixa dosagem. Essas 
duas distancias estao representadas na Figura 
8.1 por setas verticals. Se a hipotese nula e ver- 
dadeira e todos os grupos tern a mesma media, 


esses coeficientes b devem ser 0 (porque se as 
medias dos grupos sao iguais, as diferencas 
entre elas serao iguais a zero). 

A logica da ANOVA deriva do que enten- 
demos sobre regressao: 

• O modelo mais simples que podemos 
ajustar a um conjunto de dados e a me¬ 
dia geral (a media da variavel de saida). 
Quando esse modelo basico e ajustado, 
havera uma grande quantidade de erro en¬ 
tre o modelo e os dados observados. 

• Uma de muitas opgoes de linhas retas 
pode ser escolhida para modelar os dados 
coletados. Se esse modelo adere bem aos 
dados, ele deve ser melhor do que utilizar 
a media geral. 

• O intercepto e um ou mais dos coeficien¬ 
tes de regressao podem descrever a linha 
escolhida. 
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• Os coeficientes de regressao determinam 
a inclinagao da linha; dessa forma, quanto 
maior os coeficientes, maior o desvio en- 
tre a linha e a media geral. 

• Na ANOVA, os coeficientes de regressao 
sao definidos pelas diferengas entre me- 
dias de grupos. 

• Quanto maior as diferengas entre medias 
dos grupos, maior a diferenga entre a li¬ 
nha de regressao e a media geral. 

• Se as diferengas entre as medias dos gru¬ 
pos sao grandes o suficiente, a linha re- 
sultante sera um modelo melhor do que a 
media geral. 

• Alem disso, se as medias dos grupos sao 
significativamente diferentes, o modelo 
de regressao deve se ajustar melhor do 
que a media geral. 

Podemos ver se a ultima afirmagao e ver- 
dadeira comparando a melhoria no ajuste de- 
vido ao uso do modelo (em vez de utilizar a 
media geral) com o erro que permanece. Outra 
forma de dizer isso e que quando a media ge¬ 
ral e utilizada como um modelo, existira certa 
quantidade de variagao entre os dados e a me¬ 
dia geral. Quando o modelo e ajustado ele ira 
explicar parte dessa variagao, mas parte ainda 


permanecera nao-explicada. A estatistica F e a 
razao entre a variagao explicada e a nao-expli- 
cada. Veja novamente a Segao 5.2.3 para re- 
frescar a memoria sobre esses conceitos antes 
de prosseguir. Isso pode parecer complicado, 
mas, de fato, quase tudo se resume a variagoes 
de uma equagao simples (veja o Quadro 8.1). 

8.2.4 Soma dos quadrados Total (SS T ) © 

Para encontrar a variagao total dentro dos 
nossos dados calculamos as diferengas entre 
cada valor observado e a media geral (media 
de todos os valores). Elevamos entao essas 
diferengas ao quadrado e adicionamos todas 
para obter a soma total dos quadrados (SS T ): 

SS T = £(*, — -^geral ) (8-4) 

Vimos tambem na Segao 1.4.1 que a va¬ 
riancia e a soma dos quadrados estao rela- 
cionadas de forma que a variancia s 2 = SS X / 
(N — 1), onde N e o numero de observagoes. 
Dessa forma, podemos calcular a soma dos 
quadrados total da variancia de todas as obser¬ 
vagoes (a variancia geral) pela modificagao 
da relagao (SS T = s 2 (N — 1)). A variancia ge- 


Quadro 8.1 


Voce pode achar surpreendente que a ANOVA se resume a uma equagao 
(bem, mais ou menos) © 

A cada estagio da ANOVA, estamos avaliando variagoes (ou desvios) de um determinado 
modelo (seja ele o modelo mais basico ou o mais sofisticado). Vimos na Segao 1.4.1 que "o 
quanto" um modelo se desvia dos dados observados pode ser expresso, em geral, na forma da 
equagao (8.3). Assim, na ANOVA, como na regressao, utilizamos a equagao (8.3) para calcular a 
aderencia ao modelo mais basico e depois a aderencia ao melhor modelo (a linha da melhor ade- 
rencia). Se o melhor modelo e mais adequado, ele deve se ajustar aos dados significativamente 
melhor do que o modelo basico: 

desvios = y](observado - modelo) 2 (8.3) 

0 ponto interessante e que todas as somas dos quadrados na ANOVA sao variagoes dessa 
equagao basica. 0 que muda e o que utilizamos como modelo e os dados que sao ajustados. 
Olhe as varias segoes das somas dos quadrados e compare as equagoes resultantes com a equa¬ 
gao (8.3); espero que voce consiga ver que todas sao variagoes dessa equagao basica! 
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ral e a variagao entre todos os escores, inde- 
pendentemente das condigSes experimentais 
a que esses escores foram submetidos. Alern 
disso, na Figura 8.1 ela sera a soma das dis- 
tancias ao quadrado entre cada valor e a linha 
cheia horizontal. A variancia geral para os da¬ 
dos do Viagra e apresentada na Tabela 8.1 e 
se contarmos o nurnero de observagoes encon- 
traremos que sao 15 no total. Portanto, SS T e 
determinado da seguinte forma: 

SS T = Sg eral (n — 1) 

= 3,124(15- 1) 

= 3,124 x 14 
= 43,74 

Antes de prosseguirmos, e importante 
entender o que sao graus de liberdade; assim, 
leia o Quadro 8.2. 

8.2.5 Soma dos Quadrados do Modelo 
(SSJ @ 

Por enquanto, sabemos que a quantidade 
de variagao entre os dados e 43,74 unidades. 
Agora precisamos saber quanto o modelo de 
regressao pode explicar dessa variagao. Na 


ANOVA, o modelo e baseado nas diferengas 
entre as medias dos grupos, desse modo, a 
soma dos quadrados do modelo nos informa 
quanto da variagao total pode ser explicado 
pelo fato de que dados diferentes provem de 
grupos diferentes. Resumindo, o modelo repre- 
senta o efeito da manipulagao experimental. 

Na Segao 5.2.3, vimos que a soma dos 
quadrados do modelo e calculada tomando-se 
as diferengas entre os valores previstos pelo 
modelo e a media geral (veja a Figura 5.3). Na 
ANOVA, os valores previstos pelo modelo sao 
as medias dos grupos (portanto, na Figura 8.1 
as linhas pontilhadas representam os valores 
da libido previstos pelo modelo). Para cada 
participante o valor previsto pelo modelo e a 
media do grupo a qual pertence o participante. 
No exemplo do Viagra, o valor previsto para 
os cinco participantes no grupo-placebo e 2,2, 
para os cinco participantes do grupo de bai- 
xa dosagem esse valor e 3,2 e para os cinco 
participantes do grupo de alta dosagem, 5,0. 
A soma dos quadrados do modelo requer que 
calculemos as diferengas entre o valor previsto 
de cada participante e a media geral. Essas di¬ 
ferengas sao entao elevadas ao quadrado e adi- 
cionadas (por razoes que ja devem estar claras 


Quadro 8.2 


Graus de liberdade (D 

0 conceito de graus de liberdade (gl) e dificil de explicar. Ja o mencionei varias vezes ao longo 
do livro sem, no entanto, defini-lo. Muitos livros didaticos nao explicam bem a ideia (embora Ho¬ 
well, 2002, p. 56, faga um bom trabalho) e este livro nao sera uma excegao a regra! Vou comegar 
com uma analogia. Imagine que voce seja o treinador de um time de rugbi e tenha uma planilha 
do time com 15 celulas vazias que correspondem as posigoes dos jogadores no campo. Existe 
uma formagao padrao nesse esporte: cada time tern 15 posigoes especificas que devem perma- 
necer constantes durante o jogo. Quando o primeiro jogador chega existem 15 posigoes livres 
em que ele pode ser colocado. Voce coloca o nome desse jogador em uma celula da planilha e o 
aloca em uma posigao (por exemplo, linha media); uma posigao no campo agora esta ocupada. 
Quando o jogador seguinte chega, existem 14 posigoes livres e voce ainda tern a liberdade de 
escolher em que posigao o jogador sera colocado. A medida que mais jogadores sao alocados, 
chegara um ponto em que 14 posigoes ja estarao preenchidas e restara um jogador. Nao ha liber¬ 
dade de escolher a posigao desse jogador, porque so existe uma possivel. Portanto, existem 14 
graus de liberdade, isto e, voce tern possibilidade de escolher onde 14 jogadores irao jogar, mas 
para um jogador nao ha escolha. O grau de liberdade e um a menos que o nurnero de jogadores. 

(i Continua) 
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Quadro 8.2 ( Continuagao) 


Em termos estatisticos, os graus de liberdade estao relacionados ao numero de observagoes 
que sao livres para variar. Se retirarmos uma amostra de quatro observagoes de uma populagao 
para estimarmos o seu desvio padrao, precisaremos utilizar a media da amostra como uma esti- 
mativa da media da populagao. Assim, manteremos um valor constante. Digamos que a media 
da amostra seja 10; vamos assumir que a media da populagao seja esse valor e vamos mante-lo 
constante. Com esse valor fixado, os quatro valores da amostra podem variar? A resposta e nao 
porque para manter a media constante somente tres valores podem variar. Por exemplo, se os 
valores da amostra forem 8, 9, 11 e 12 (media = 10) e trocarmos tres desses valores por 7, 15 e 
8, o ultimo valor deve ser 10 para que a media nao seja alterada. Portanto, se mantivermos um 
parametro constante, os graus de liberdade devem ser o tamanho da amostra menos um. Esse 
fato explica por que, quando utilizamos uma amostra para estimar o desvio padrao da populagao 
(como fizemos na Segao 1.4.1), devemos dividir a soma dos quadrados por N - 1 em vez de por 
N apenas. Para o SS T , utilizamos a totalidade da amostra para determinar a soma dos quadrados, 
assim o total de graus de liberdade (GL T ) sera o tamanho da amostra menos um (N - 1). Para os 
dados do Viagra, esse valor e 14. 


para voce a essa altura). Sabemos que o valor 
previsto para os participantes em um grupo 
especffico e a media desse grupo. Portanto, a 
forma mais simples de calcular a SS M e: 

1. Calcular as diferengas entre a media de 
cada grupo e a media geral. 

2. Elevar cada uma dessas diferengas ao 
quadrado. 

3. Multiplicar cada resultado pelo numero de 
participantes dentro de cada grupo ( n k ). 

4. Somar os valores de cada um dos grupos. 

A expressao resultante desse processo e 
mostrada na equagao (8.5): 

SS M = El n k (x k - x geral ) 2 (8.5) 

Utilizando as medias dos dados do Viagra, 
podemos calcular a SS M da seguinte forma: 

SS M = 5(2,200 - 3,467) 2 + 5(3,200 - 3.467) 2 
+ 5(5,000 - 3,467) 2 

= 5(—1,267) 2 + 5(—0,267) 2 + 5(1,533 ) 2 
= 8,025 + 0,355 + 11,755 
= 20,135 

Para a SS M , os graus de liberdade GL M 
serao sempre menos um o numero de para- 
metros estimados menos um. Em resumo, o 


valor sera o numero de grupos menos 1 (que 
representaremos por k - 1). Assim, no caso de 
tres grupos, o numero de graus de liberdade 
sera 2 (em virtude dos calculos da soma dos 
quadrados ter por base a media dos grupos, 
duas serao livres para variar na populagao se a 
terceira for mantida constante). 

8.2.6 Soma dos Quadrados dos Residuos 
(SS R ) © 

Sabemos que existem 43,74 unidades de 
variacao para serem explicadas nos nossos da¬ 
dos e que nosso modelo pode explicar 20,14 
dessas unidades (aproximadamente a meta- 
de). A soma final dos quadrados e a soma dos 
quadrados dos residuos (SS R ), que informa 
quanto da variagao total nao pode ser explica- 
do pelo modelo. Esse valor e a quantidade de 
variacao causada por fatores estranhos, como 
diferengas individuals de peso, testosterona 
ou outros. Seja conhecemos SS X e SS M , entao 
a maneira mais facil de calcular o valor de SS R 
e subtraindo SS M de SS T (SS R = SS T - SS M ); 
contudo, fazendo isso teremos pouca ideia do 
que estamos calculando e, e claro, se errarmos 
no calculo da SS M ou da SS T (ou de ambos), 
a SS R tambem estara errada. Vimos na segao 
5.2.3 que a soma dos quadrados dos residuos 
e a diferenga entre o que o modelo preve e o 
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que e observado de fato. Sabemos que para 
um dado participante, o modelo preve a me¬ 
dia do grupo que esse participante pertence. 
Portanto, SS R e calculado pela diterenca entre 
o escore obtido por essa pessoa e a media do 
grupo que ela pertence. Em termos graficos, 
as linhas verticais na Figura 8.1 representam 
essa soma dos quadrados. Essas distancias en¬ 
tre cada dado e a media do grupo sao elevadas 
ao quadrado e entao somadas para fornecer a 
soma dos quadrados dos resfduos, SS R (veja a 
equagao (8.6)): 

SS r =£(*,-^) 2 ( 8 . 6 ) 

Agora, a soma dos quadrados para cada 
grupo representa a soma das diferengas ao 
quadrado entre o escore de cada participante 
no grupo e a media do grupo. Portanto, pode- 
mos expressar a SS R como SS R = SS Grapol + 
SS Grapo2 + ... + SS Grupok . Dado que sabemos 
a relagao entre a variancia e a soma dos qua¬ 
drados, podemos utilizar a variancia de cada 
grupo dos dados do Viagra para criar uma 
equagao como a que foi feita para a soma total 
dos quadrados. Dessa forma, a SS R pode ser 
expressa pela equagao (8.7): 

SS r =]T^(«,-1) (8.7) 


delo do numero de graus de liberdade total, isto 
e, gl R = gl T — gl M = 14 — 2 = 12. Colocando 
de outra forma, isso e N — k, ou seja, o total da 
amostra ( N) menos o numero de grapos ( k ). 

8.2.7 Medias ao quadrado © 

O valor SS M nos informa quanto da va¬ 
riagao o modelo de regressao (por exemplo, a 
manipulagao experimental) explica e o SS R in¬ 
forma quanto da variagao pode ser creditado a 
fatores estranhos. Contudo, por que esses va- 
lores sao somas, eles serao influenciados pelo 
numero de valores que foram adicionados (por 
exemplo, SS M utiliza a soma de apenas tres 
valores diferentes - as medias dos grupos - 
comparadas a SS R e SS T , que utilizam a soma 
de 14 valores diferentes). Para eliminar esse 
vies, e possfvel calcular a soma dos quadrados 
media (conhecida como media dos quadra¬ 
dos, MS), que sao simplesmente as somas dos 
quadrados divididas pelos graus de liberdade. 
Dividimos pelo numero de graus de liberdade 
em vez de pelo numero de parametros utili- 
zados para calcular a SS porque estamos ten- 
tando extrapolar para uma populagao e alguns 
parametros dentro da populagao serao cons- 
tantes. Assim, para os dados do Viagra, vamos 
obter as seguintes medias dos quadrados: 


Isso significa que devemos pegar a va¬ 
riancia de cada grupo (si) e multiplica-la pelo 
numero de pessoas naquele grupo menos um 
(n k - 1). Depois de fazer isso para cada grupo, 
some todos os resultados. Para os dados do 
Viagra, teremos: 

SS R = Sgmpo !(«! - 1) + Sgrupo2(«2 ~ 1) 

"b ^ grupo 3(^3 1 ) 

= (1,70)(5 - 1) + (1,70)(5 -1) + (2,50) 
(5-1) 

= (1,70 X 4) + (1,70 X 4) + (2,50 X 4) 

= 6,8 + 6 , 8 + 10 

= 23,60 

O numero de graus de liberdade para a 
quantidade SS R ( gl R ) pode ser obtido subtrain- 
do-se o numero de graus de liberdade do mo- 


MS m = 

ms r = 


SSm 

gl M 

SSr 
gl R 


20,135 

2 

23,60 _ 

12 


= 10,067 
1,967 


MS m representa a quantidade media de 
variagao explicada pelo modelo (isto e, a va¬ 
riagao sistematica). Ja MS R e uma medida da 
quantidade media de variagao explicada pelas 
variaveis estranhas (variagao nao-sistematica). 


8.2.8 A razao F © 

A razao F e uma medida da variagao ex¬ 
plicada pelo modelo dividida pela variagao 
explicada por fatores nao-sistematicos. Ela 
pode ser calculada pela divisao da media dos 
quadrados do modelo pela media dos quadra¬ 
dos dos resfduos: 
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f = ^m ( 8 . 8 ) 

MS r 

Assim como o teste t independente, a razao 
F e uma medida da razao das varia 9 oes sistema- 
ticas para as nao-sistematicas. Como tal, ela e 
razao do efeito experimental para as diferengas 
individuals de desempenho. Um ponto interes- 
sante sobre a razao F e que, em virtude dela ser 
um quociente entre as varia$oes sistematicas e 
nao-sistematicas, se o seu valor for menor do 
que 1, entao por definicao ela representa um 
efeito nao-significativo. Isso e verdade porque 
se a razao F e menor do que 1, significa que 
a MS r e maior do que a MS m , que em termos 
reais significa que existe mais variagao nao-sis- 
tematica do que sistematica. Voce pode pensar 
nisso em termos do efeito de diferengas naturais 
na habilidade serem maiores do que as diferen- 
gas introduzidas pelo experimento. Nesse cena- 
rio, podemos estar seguros de que a nossa ma- 
nipulagao experimental nao foi bem-sucedida 
(porque ela trouxe menos mudan$as do que se 
tivessemos deixado os participantes por si so!). 
Para os dados do Viagra a razao F e: 

F _MS m _ 10,067 _ 51 . 

MSr 1,967 

Esse valor e maior do que 1, o que indica 
que a manipulacao experimental teve um efeito 
alem do efeito das diferen£as de desempenho 
individuals. Contudo, ela nao nos informa se a 
razao F e grande o suficiente para nao ser um 
resultado casual. Para descobrir isso, devemos 
comparar o valor de F obtido contra o valor 
maximo que seria esperado apenas por acaso 
utilizando uma distrihuicao F com os mesmos 
graus de liberdade (esses valores podem ser 
encontrados no Apendice A.3). Se o valor que 
obtivemos exceder esse valor critico, podemos 
estar confiantes de que ele reflete um efeito da 
variavel independente. Nesse caso, com 2 (gl m ) 
e 12 (gl r ) graus de liberdade, os valores crfticos 
sao 3,89 (p = 0,05) e 6,93 (p = 0,01), respecti- 
vamente. O valor observado, 5,12, e, dessa for¬ 
ma, significativo a 5%, mas nao a 1%. Portan- 
to, a significancia exata fornecida pelo SPSS 
deve estar entre 0,05 e 0,01 (e de fato esta). 


8.2.9 Suposigoes da AN0VA © 

As suposi$oes sob as quais a ANOVA e con- 
fiavel sao as mesmas dos testes parametricos ba- 
seados na distribuigao normal (veja a Se^ao 3.2). 
Isto e, os dados devem ser de uma populagao dis- 
tribui'da normalmente, as variancias em cada uma 
das condi§oes experimentais devem ser homoge- 
neas, as observacjoes devem ser independentes e 
a variavel dependente deve ser mensurada pelo 
menos em uma escala de intervalo. Embora eu 
esteja sempre falando sobre a importancia das 
hipoteses elas nao sao totalmente inflexfveis. 
Por exemplo, Lunney (1970) investigou o uso da 
ANOVA quando a variavel dependente e dicoto- 
mica (podemos ter valores do tipo 0 e 1 apenas). 
Os resultados mostraram que quando os tama- 
nhos dos grupos eram iguais, a ANOVA era pre- 
cisa quando existiam pelo menos 20 graus de li¬ 
berdade e a menor categoria continha no mrnimo 
20% de todas as respostas. Se a menor categoria 
de respostas continha menos do que 20% de to¬ 
das as respostas, a ANOVA era precisa somente 
quando existiam 40 ou mais graus de liberdade. 
Esse estudo mostra que a ANOVA pode ser um 
procedimento bastante robusto. 

Em termos de violagao das hipoteses de 
homogeneidade da variancia, a ANOVA e bas¬ 
tante robusta quando os tamanhos amostrais sao 
iguais. Contudo, quando os tamanhos das amos- 
tras sao diferentes, a ANOVA nao e robusta a 
violagoes da homogeneidade da variancia (por 
isso disse antes que vale a pena tentar coletar 
dados em grupos de mesmo tamanho!). Quando 
grupos com grandes tamanhos amostrais apre- 
sentam variancias maiores do que grupos com 
tamanhos amostrais menores, a razao F resultan- 
te tende a ser conservadora. Quer dizer, e mais 
provavel obter um resultado nao-significativo 
mesmo quando existe uma diferen^a genuina 
na populagao. Ja quando os grupos com grandes 
tamanhos amostrais apresentam variancias me¬ 
nores do que os grupos com tamanhos amostrais 
menores, a razao F resultante tende a ser liberal. 
Ou seja, e mais provavel obter um resultado sig¬ 
nificativo quando nao existe uma diferenga entre 
os grupos na popula^ao (ou seja, a taxa de Erro I 
nao e controlada) - veja Glass, Peckham e Saun¬ 
ders (1972) para mais detalhes sobre o assunto. 
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Os problemas resultantes da violagao da 
hipotese da homogeneidade das variancias 
podem ser corrigidos (veja o Quadro 8.3). 
Assim, o problema mais serio e a violagao 
da hipotese de independence. Scariano e Da¬ 
venport (1987) mostraram que quando essa 
hipotese e violada (isto e, as observagoes 
entre os grupos sao correlacionadas), a taxa 
de erro do Tipo I aumenta substancialmente. 
Por exemplo, utilizando o valor convencional 
de 5% para o erro do Tipo I da situagao de 
observagoes independentes, se essas observa¬ 
nces forem modificadas de modo que tenham 
uma correlagao moderada (digamos, com um 
coeficiente de Pearson de 0,5), quando formos 
comparar tres grupos de 10 observagoes por 
grupo, a taxa real de erro do Tipo I sera 0,74 
(um aumento substancial!). Portanto, se as ob¬ 
servagoes forem correlacionadas, voce pode 
pensar que esta trabalhando com uma taxa de 
erro de aceitagao de 5% (isto e, voce ira en- 
contrar um efeito significativo de modo incor- 
reto apenas 5% das vezes) quando, de fato, a 
taxa de erro verdadeira esta proxima de 75% 
(isto e, encontraremos um resultado significa¬ 
tivo em 75% das vezes quando na realidade 
nao existe tal efeito na populagao). 

8.2.10 Contrastes planejados © 

A razao F nos informa apenas que o mo- 
delo ajustado aos dados e responsavel por mais 
variagao do que fatores estranhos, mas ela nao 
informa quais grupos diferem. Assim, se o valor 
F e grande o suficiente para ser estatisticamente 
significativo, sabemos apenas que uma ou mais 
das diferengas entre as medias e estatisticamen¬ 
te significativa (por exemplo, tanto b, quanto 
sao estatisticamente significativos). Portanto, 
apos a realizagao da ANOVA precisamos exe- 
cutar analises adicionais para descobrir quais 
grupos diferem entre si. Na regressao multipla, 
cada coeficiente b e testado individualmente 
por meio do teste t e devemos fazer o mesmo 
para a ANOVA. Contudo, precisaremos execu- 
tar dois testes t, que devera inflacionar o erro de 
conjunto (familywise error rate ) (veja a Segao 
8.2.1). Desse modo, precisamos encontrar uma 
maneira de comparar os diferentes grupos sem 


inflacionar a taxa de erro do Tipo I. Existem 
duas formas de fazer isso. A primeira e divi- 
dir a variancia de responsabilidade do modelo 
nas suas parcelas componentes e a segunda e 
comparar cada grupo (como se estivessemos 
realizando varios testes t), mas utilizando um 
criterio de aceitagao mais restrito de forma que 
o erro de conjunto nao ultrapasse o valor fixa- 
do (0,05). A primeira opgao e executada utili- 
zando-se as comparagoes planejadas (tambem 
conhecidas como contrastes planejados) 3 , e 
a segunda e realizada utilizando-se testes post 
hoc (veja a proxima segao). A diferenga entre 
comparagoes planejadas e testes post hoc pode 
ser comparada a diferenga entre testes uni e 
bilaterais, no sentido de que as comparagoes 
planejadas sao feitas quando temos hipoteses 
especificas que queremos testar, ao passo que 
os testes post hoc sao feitos quando nao temos 
hipoteses especificas. Vamos examinar primei- 
ro os contrastes planejados. 

8.2.10.1 Escolhendo que contrastes 
realizar © 

No exemplo do Viagra, podemos ter hi¬ 
poteses bastante especificas. Por um lado, es- 
peramos que qualquer dose de Viagra altere a 
libido quando comparado ao grupo-placebo. 
Como uma segunda hipotese, podemos acredi- 
tar que uma alta dosagem deve aumentar mais 
a libido do que uma baixa dosagem. Para exe- 
cutar as comparagoes planejadas, essas hipote¬ 
ses devem ser efetuadas antes dos dados serem 
coletados. E praticamente um padrao nas cien- 
cias sociais comparar as condigoes experimen- 
tais as condigoes de controle como o primeiro 
contraste e depois ver onde as diferengas estao 
entre os grupos-experimentais. A ANOVA esta 
baseada na divisao da variagao total nas suas 
duas partes componentes: a variagao devido 
a manipulagao experimental (SS M ) e a varia¬ 
gao devido aos fatores nao-sistematicos (SS R ) 
(veja a Figura 8.2). As comparagdes planejadas 
levam essa logica um passo alem, dividindo a 
variagao devido ao experimento em suas partes 


3 Os ternios “comparagoes” e “contrastes” sao utilizados 
da mesma forma. 
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ANOVA 


Figura 8.2 Partigao da variancia na ANOVA. 


componentes (veja a Figura 8.3). As compara- 
coes exatas que sao executadas dependem das 
hipoteses que se quer testar. A Figura 8.3 mos- 
tra a situagao na qual a variancia experimental 
e particionada de forma a mostrar quanto da 
variagao e de responsabilidade das duas doses 
do medicamento comparadas com a condigao 
placebo ( contrastel ). Entao a variagao explica- 
da pela ingestao do Viagra e dividida para ver 
quanto dela e explicada pela alta e pela baixa 
dosagem ( constraste2 ). 


Em geral, os estudantes tem dificuldade de 
entender a nogao de comparagoes planejadas, 
mas existem varias regras que podem ajuda-lo a 
saber o que fazer. E importante lembrar que esta- 
mos partindo uma parte da variagao em porgoes 
independentes menores. Isso significa varias 
coisas. Primeiro, se um grupo e isolado em uma 
comparagao, ele nao deve reaparecer em outra 
comparagao. Assim, na Figura 8.3, o contras- 
te 1 envolve comparar o grupo-placebo com os 
grupos-experimentais; como o grupo-placebo foi 



Contraste 1 


Contraste 2 


Figura 8.3 Partigao da variancia experimental em componentes. 
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isolado, ele nao deve ser incorporado em qual- 
quer outro contraste. Imagine a divisao da varian- 
cia como fatiar um bolo. Voce inicia com o bolo 
inteiro (a soma total dos quadrados) e depois cor- 
ta o bolo em dois (SS M e SS R ). Voce entao pega o 
pedago que representa a SS M e corta novamente 
em fatias menores. Uma vez que voce tenha cor- 
tado uma fatia do bolo voce nao pode coloca-la 
de volta no bolo original, mas pode dividi-la em 
partes ainda menores. Da mesma forma, uma vez 
que a variancia tenha sido dividida, ela nao pode 
ser anexada a qualquer outra parte da variancia; 
ela so pode ser novamente dividida em partes 
menores. Essa conversa sobre bolo esta me dei- 
xando com fome, mas espero que tenha servido 
para ilustrar o que quero dizer. 

Como uma segunda dica para selecionar 
contrastes, a regra da independence dos con- 
trastes que acabei de explicar (a divisao do 
bolo!) significa que voce deve sempre ter um 
contraste a menos que o numero de grupos 
(assim, existirao k - 1 contrastes, onde k 6 o 
numero de condigoes que estamos comparan- 
do). Finalmente, cada contraste deve comparar 
somente duas partes de variancias. Essa regra 
final e a que permite que tiremos conclusoes 
firmes sobre o que os contrastes nos dizem. A 
razao F nos informa que algumas das nossas 
medias diferem, mas nao quais, e se executas- 
semos um contraste em mais de duas partes de 
variancias, enfrentarfamos o mesmo problema. 
Comparando apenas duas partes de variancias, 
podemos estar seguros de que um resultado 
significativo representa uma diferenga entre 
essas duas porgoes de variacao experimental. 

Em muitas pesquisas nas ciencias sociais 
utilizamos pelo menos uma condigao de con- 
trole e na grande maioria dos delineamentos 
experimentais previmos que as condigoes ex- 
perimentais irao diferir da condigao de controle 
(ou condigoes). Assim, uma boa dica quando 
formos planejar comparagoes e comparar 
todos os grupos de condigoes experimentais 
com o grupo ou grupos-controle como sua 
primeira comparagao. Uma vez que tenhamos 
feito a primeira comparagao, qualquer outra re- 
manescente ira depender de quais grupos-expe- 
rimentais voce preve que irao diferir. 


Para ilustrar esses princlpios, a Figura 8.4 
e a Figura 8.5 mostram os contrastes que po- 
dem ser feitos com um experimento de quatro 
grupos. Observe que nos dois cenarios exis- 
tem tres possfveis comparagoes (uma a menos 
do que o numero de grupos). Tambem, cada 
contraste compara somente duas porgoes da 
variancia. E mais, nos dois cenarios o primeiro 
contraste e o mesmo: os grupos-experimentais 
sao comparados contra o grupo-controle (ou 
grupos). Na Figura 8.4 existe somente uma 
condigao de controle e assim essa porgao da 
variancia e utilizada somente no primeiro con¬ 
traste (porque ela nao pode ser mais dividida). 
Na Figura 8.5 existem dois grupos-controle e 
assim a porgao da variancia devido as condi- 
g5es de controle (contraste 1) pode ser divi¬ 
dida novamente como forma de verificar se 
os escores nos dois grupos-controle diferem 
entre si (contraste 3). 

Na Figura 8.4, o primeiro contraste con¬ 
tent uma parte da variancia que e acarretada 
pelos tres grupos-experimentais e essa porgao 
da variancia e dividida verificando primeira- 
mente se os grupos El e E2 diferem do E3 
(contraste 2). E igualmente valido utilizar o 
contraste 2 para comparar os grupos El e E3 
com E2, ou comparar os grupos E2 e E3 com 
El. As comparagoes exatas que voce escolher 
dependerao das suas hipoteses. Para o con¬ 
traste 2 na Figura 8.4 ser valido precisamos 
ter uma boa razao para esperar que o grupo E3 
seja diferente dos outros dois grupos. A tercei- 
ra comparagao na Figura 8.4 depende da que 
foi escolhida para o contraste 2. O contraste 
2 necessariamente deve envolver a compara¬ 
gao de dois grupos-experimentais contra um 
terceiro e os grupos-experimentais escolhidos 
para serem combinados devem ser separados 
na comparagao final. Finalmente, observe nas 
Figuras 8.4 e 8.5 que quando um grupo foi 
isolado em uma comparagao ele nao e mais 
utilizado em qualquer contraste posterior. 

Quando executamos um contraste planeja- 
do, comparamos “porgoes” de variancia e es¬ 
sas porgoes as vezes consistem em varios gru¬ 
pos. As vezes e confuso entender exatamente 
o que esses contrastes nos informam. Quando 
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Figura 8.4 Partigao da variancia para comparagoes planejadas em um experimento de quatro 
grupos onde um e o grupo-controle. 


voce planeja um contraste 
que compara varios grupos a 
outro grupo, voce esta com- 
parando as medias dos grupos 
em uma porcao com a media 
do grupo em outra porcao. 
Como exemplo, para os dados 
do Viagra eu sugeri que um 
primeiro contraste apropria- 
do seria a comparagao dos 
grupos das duas dosagens (alta e baixa) com 
o grupo-placebo. As medias dos grupos sao 
2,20 (placebo), 3,20 (de baixa dosagem) e 5,00 
(alta dosagem); assim, a primeira comparagao 
- que compara os dois grupos-experimentais 
contra o placebo - e comparar 2,20 (media do 
grupo-placebo) com a media dos outros dois 
grupos ((3,20 + 5,00)/2 = 4,10). Se esse pri¬ 
meiro contraste for significativo, podemos 


concluir que 4,10 e significativamente maior 
do que 2,20. Em termos do experimento, isso 
nos informa que a media desses grupos-ex¬ 
perimentais e significativamente diferente da 
media do grupo-controle. Logicamente, isso 
significa que, se os erros padrao sao os mes- 
mos, o grupo-experimental com a media mais 
alta (o grupo de alta dosagem) sera significati¬ 
vamente diferente da media do grupo-placebo. 
Contudo, o grupo-experimental com a media 
mais baixa (grupo de baixa dosagem) pode 
nao diferir necessariamente do grupo-placebo; 
precisamos utilizar uma ultima comparagao 
para esclarecer essas condicoes experimentais. 
Para os dados do Viagra, a comparagao final 
e verificar se as duas condigoes experimentais 
diferem (isto e, as medias dos grupos de alta 
e baixa dosagem sao significativamente dife- 
rentes). Se essa comparacao for significativa, 
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Figura 8.5 Partigao da variancia para comparagoes planejadas em urn experimento de quatro 
grupos em que dois sao grupos-controle. 


podemos concluir que uma alta dose de Via¬ 
gra afeta significativamente mais a libido do 
que uma baixa dosagem do medicamento. Se 
a comparagao nao for significativa, aceitamos 
que a dosagem do Viagra nao afetou a libido. 
No primeiro caso, provavelmente as duas si- 
tuagSes (alta e baixa dosagem) afetam a libido 
mais do que o placebo; ja a segunda situagao 
implica que uma dosagem baixa pode nao ser 
diferente do que tomar o placebo. Contudo, a 
palavra implica e importante aqui: e possivel 
que o grupo de baixa dosagem nao difira do 
grupo-placebo. Para verificarmos isso, deve- 
mos executar um teste post hoc. 

8.2.10.2 Definindo contrastes ponderados (D 

Espero que a essa altura voce ja tenha al- 
guma ideia de como planejar as suas compa¬ 


ragoes (se o seu cerebro ainda nao explodiu!). 
Adoraria dizer a voce que o dificil ja passou 
e que o SPSS ira magicamente executar as 
comparagoes que voce selecionou, mas isso 
nao seria verdade. Para que o SPSS execute 
as comparagoes planejadas, voce precisa in¬ 
formal' quais grupos deverao ser comparados, 
e fazer isso pode ser complicado. De fato, 
quando executamos contrastes atribufmos va- 
lores a certas variaveis no modelo de regressao 
(desculpe, mas vou ter que falar sobre regres¬ 
sao de novo) - da mesma forma que fizemos 
quando utilizamos a codificagao dummy (au- 
xiliar) para a ANOVA principal. Para executar 
os contrastes, simplesmente atribmmos certos 
valores a variaveis auxiliares no modelo de re¬ 
gressao. Enquanto anteriormente definimos os 
grupos-experimentais atribuindo as variaveis 
auxiliares os valores 0 e 1, quando executamos 






































Descobrindo a Estatistica Usaimdo o SPSS 315 


os contrastes utilizamos valores diferentes para 
especificar quais grupos queremos comparar. 
Os coeficientes resultantes no modelo de re- 
gressao (b 2 e /?,) representam as comparagoes 
nas quais estamos interessados. Os valores 
atribuidos as variaveis dummy (auxiliares) sao 
conhecidos como pesos (ponderagoes). 

Esse procedimento e confuso, mas exis- 
tem algumas regras basicas para atribuir valo¬ 
res as variaveis auxiliares a fim de obtermos 
as comparagoes desejadas. Explicarei essas 
regras antes de revelar como o processo fun- 
ciona de fato. Lembre da segao anterior quan- 
do voce leu essas regras e pense sobre o signi- 
ficado de “porgao” de variagao! 

• Regra 1: Escolha comparagoes sensiveis. 
Lembre que voce quer comparar somente 
duas porgoes de variagao e que se um gru- 
po e isolado em uma comparagao, entao 
esse grupo deve ser excluido de qualquer 
contraste subsequente. 

• Regra 2: Grupos codificados com ponde- 
ragoes positivas serao comparados com 
grupos codificados com ponderagoes ne- 
gativas. Assim, atribua a uma porgao da 
variagao ponderagoes positivas e a porgao 
oposta, ponderagoes negativas. 

• Regra 3 A soma das ponderagoes (pesos) 
para uma comparagao deve ser zero: se 
voce somar os pesos para um determina- 
do contraste o resultado deve ser zero. 


• Regra 4: Se um grupo nao esta envolvido 
em uma comparagao, atribua automatica- 
mente o peso 0. Se for dado o peso 0 a 
um grupo, elimine esse grupo de qualquer 
outro calculo. 

• Regra 5: Para um dado contraste, os pe¬ 
sos atribuidos aos grupos em uma porgao 
da variagao deve ser igual ao numero de 
grupos na porgao contraria da variagao. 

Vamos usar algumas dessas regras a fim 
de determinar as ponderagoes para os dados 
do Viagra. A primeira comparagao que esco- 
lhemos foi comparar os dois grupos-experi- 
mentais contra o grupo-controle: 

Portanto, a primeira porgao da variagao 
contem os dois grupos-experimentais e a se- 
gunda parte contem somente o grupo-placebo. 
A regra 2 diz que devemos atribuir a uma por¬ 
gao ponderagoes positivas e a outra, negativas. 
Nao importa a ordem em que isso e feito, mas 
por conveniencia vamos atribuir a porgao 1 
uma ponderagao positiva e a 2, negativa. 

Utilizando a regra 5 os pesos atribuidos 
aos grupos na porgao 1 devem ser equivalentes 
aos valores atribuidos aos grupos na porgao 2. 
Existe somente um grupo na porgao 2, assim, 
atribuimos a cada grupo na porgao 1 o peso 
de 1. Da mesma forma, atribuimos ao grupo 
na porgao 2 um peso igual ao numero de gru¬ 
pos na porgao 1. Ha dois grupos na pogao 1, 
portanto, atribuimos ao grupo-placebo peso 2. 
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Depois, combinamos os sinais dos pesos com 
a magnitude e chegamos a —2 (placebo), 1 
(dosagem baixa) e 2 (dosagem alta): 

A regra 3 declara que para um dado con- 
traste, a soma dos pesos deve ser zero; se as 
regras 2 e 5 forem seguidas, essa regra sempre 
sera satisfeita (se voce nao seguiu adequada- 
mente essas regras, isso ira aparecer quando 
os pesos forem somados). Vamos verificar so- 
mando os pesos: 1 + 1 — 2 = 0. 

O segundo contraste sera comparar os dois 
grupos-experimentais e assim iremos ignorar o 
grupo-placebo. A regra 4 nos diz que devemos 
atribuir a esse grupo uma ponderagao igual a 
0 (porque dessa forma iremos elimina-lo de 
qualquer calculo). Restam ainda duas porgoes 
de variagao: a porcao 1, que content a variagao 
do grupo de baixa dosagem, e a porcao 2, que 
content a variagao do grupo de alta dosagem. 
Seguindo as regras 2 e 5 devemos atribuir a urn 
grupo o peso +1 e ao outro grupo o peso — 1. 
O grupo-controle e ignorado (e assim ele tera 


urn peso de 0). Se adicionarmos os pesos do 
contraste 2, veremos que a soma devera ser no- 
vamente zero, isto e, 4-1 — 1 +0 = 0. 

Os pesos para cada contraste sao codifica- 
dos para duas variaveis dummy (auxiliares) na 
equagao 8.2. Assim, esses codigos podem ser 
utilizados num modelo de regressao multipla 
no qual b 2 representa o contraste 1 (comparan- 
do os grupos-experimentais ao grupo-contro¬ 
le), b, representa o contraste 2 (comparando 
os grupos de alta e baixa dosagem) e b 0 e a 
media geral (equagao (8.9)): 

Libido,- = b 0 + ^Contraste! 

+ £> 2 Contraste 2 (8.9) 

Cada grupo e especiftcado agora nao pelo 
esquema de codigos 0 e 1 que foi inicialmente 
utilizado, mas pelo esquema de codigos dos dois 
contrastes. Um codigo de —2 para o primeiro 
contraste e um codigo de 0 para o segundo con¬ 
traste identificam os participantes no grupo-pla¬ 
cebo. Da mesma forma, o grupo de alta dosagem 
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pode ser identificado pelo c6- 
digo 1 nas duas variaveis e o 
codigo de baixa dosagem tem 
o codigo 1 para um contraste 
e um codigo — 1 para o outro 
(vejaaTabela 8.4). 

E importante que os 
pesos para as comparaqoes 
somem zero porque isso ira 
assegurar que voce esta comparando duas por- 
goes linicas de variagao. Desse modo, o SPSS 
pode executar um teste t. Ainda mais importan¬ 
te e que quando voce multiplica os pesos para 
um grupo em particular a soma desses produ- 
tos tambem deve ser zero (veja a ultima coluna 
da Tabela 8.4). Se a soma dos produtos e zero, 
podemos estar seguros de que os contrastes sao 
ortogonais ou independentes. E importante 
para a interpretaqao que os contrastes sejam or¬ 
togonais. Quando utilizamos a codificaqao com 
variaveis auxiliares e executamos uma regres¬ 
sao nos dados do Viagra, comentei que nao po- 
dfamos olhar para os testes 1 individuals execu- 
tados nos coeficientes da regressao em virtude 
da inflagao na taxa de erro de conjunto (veja a 
Seqao 8.2.10 e a Saida 8.1 do SPSS). Contudo, 
se os contrastes sao independentes, os testes t 
executados nos coeficientes b sao, tambem, 
independentes e assim os valores p resultantes 
nao se correlacionam. Pode parecer dificil asse¬ 
gurar que os pesos escolhidos para os contrastes 
sejam adequados para garantir a independence, 
mas contanto que as regras sejam seguidas voce 
sempre tera em maos um conjunto de compara- 
9 oes ortogonais. Portanto, e necessario sempre 
verificar se a soma dos produtos dos pesos dos 
contrastes e zero; se isso nao ocorrer, volte para 
a lista de regras a fim de descobrir o que nao 
deu certo (veja a ultima coluna da Tabela 8.4). 




Mencionei anteriormente 
que quando utilizamos os codigos 
das variaveis auxiliares nos con¬ 
trastes em um modelo de regres¬ 
sao, os valores b representam as 
diferengas entre as medias que os contrastes pla- 
nejaram testar. Embora seja razoavel acreditar 
em mim nessa questao, para os estudantes mais 
avangados quero me dar ao trabalho de mostrar 
como o modelo de regressao funciona. Assim, a 
proxima parte e para os corajosos; quern tem fo- 
bia a equates deve seguir direto para a proxima 
segao. Quando executamos contrastes planeja- 
dos, o intercepto b 0 e igual a media geral (isto e, 
o valor previsto pelo modelo quando a pertinen- 
cia a um grupo nao e conhecida): 


media geral = 


Alta 1" ■ -hXp, 


Grupo-placebo: Se utilizarmos os codi¬ 
gos dos contrastes para o grupo-placebo (veja 
a Tabela 8.4), o valor previsto da libido sera 
igual a media do grupo-placebo. A equacao de 
regressao pode, portanto, ser expressa como: 

Libido,- = b 0 + IqContraste! + fo 2 Contraste 2 


^Placebo 


^Alta ^Baixa ^Placebo 


+ {-2b x ) + ( b 2 x 0) 

Rearranjando essa equacao e multiplicando 
tudo por 3 (para eliminar a fraqao) obtemos: 
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Tabela 8.4 Contrastes ortogonais para os dados do Viagra 


Grupo 

Variavel auxiliar 1 
(Contrasted 

Variavel auxiliar 2 
(Contrasted 

Produto 

Contraste, x Contraste 2 

Placebo 

-2 

0 

0 

Baixa dosagem 

1 

-1 

-1 

Alta dosagem 

1 

1 

1 

Total 

0 

0 

0 
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Podemos, entao, dividir tudo por 2 para 
reduzir a equagao a sua forma mais simples: 


3^ 

h 


^Alta ~b ^Baixa 


-X, 


1 

3 L 


^Alta b ^Baixa 


Placebo 


' ^Plnrpl 


Essa equagao mostra que /;, representa a 
diferenga entre as medias dos dois grupos-ex- 
perimentais e a media do grupo-controle: 

q U _ I ^Alla 3” ^Baixa \ v 

3D \ — I 2 I A Placebo 


2 

= 1,9 


Planejamos que o contraste 1 representas- 
se a diferenga entre a media dos grupos-expe- 
rimentais e o grupo-controle, assim, deve estar 
claro agora que b l representa essa diferenga. 
Os mais observadores devem ter notado que 
b { em vez de ser a verdadeira diferenga entre 
as medias dos grupos-experimentais e a do 
grupo-controle e de fato um tergo dessa dife¬ 
renga (hi = 1,90/3 = 0,633). A razao para essa 
divisao e que o erro de conjunto e controlado 
fazendo com que o coeficiente de regressao 
seja igual a diferenga real dividida pelo numero 
de grupos no contraste (no caso, 3). 

Grupo de alta dosagem: Para a situagao 
em que os codigos para o grupo de alta dosa¬ 
gem (veja a Tabela 8.4) sao utilizados, o valor 
previsto da libido e a media para o grupo de 
alta dosagem; desse modo, a equagao de re¬ 
gressao torna-se: 

Libido, = b 0 + Contraste + /;,Contraste, 

-^Alta = ^0+ X 1) + (bn X 1) 

^2 = ^Alta — bl — b 0 

Ja sabemos o que /?, e b 0 representam e 
assim colocamos esses valores na equagao e 
multiplicamos por 3 para nos livrarmos de 
parte das fragoes: 


^2 — ^Alta b o 



(^Alta ^Baixa ~b -^Placebo ) 


1 


Se multiplicarmos tudo por 2 para nos 
livrarmos da outra fragao, retirarmos os col- 
chetes e parenteses e fizermos simplificagoes, 
teremos: 


6t?2 62 f A ] ta _ ( 2 fAJta_“b -^Baixa_ ^-^Placebo) 

^ C^Alta “b Afiaixa “b ^Placebo) 

9 /X 62 f A i ta _ A^|ta “ 2f B aixa ~^^^Placebo 
^ ^Atta —^Baixa — ^Placebo 

6^2 = 3X Alta — 3A Baixa 


Finalmente, podemos dividir toda a equa¬ 
gao por seis para descobrir o que b 2 significa: 

* 2 =^(*A*-*B.cJ 


Planejamos o contraste 2 para representar 
a diferenga entre os grupos-experimentais: 

-^Alta — -^Baixa = 5 — 3,2 =1,8 

Deve estar claro agora que b 2 representa 
essa diferenga. Novamente, em vez de obter- 
mos o valor real da diferenga entre as medias 
dos grupos-experimentais, b 2 e, de fato, me- 
tade dessa diferenga (1,8/2 = 0,9). O erro de 
conjunto e novamente controlado, fazendo o 
coeficiente de regressao igual a diferenga real 
dividida pelo numero de grupos envolvidos no 
contraste (nesse caso, 2). 

Para ilustrar esses princlpios, criei um 
arquivo denominado Contrast.sav em que os 
dados do Viagra estao codificados com base 
no esquema de codigos utilizado nessa segao. 
Execute uma analise de regressao multipla 
nesses dados utilizando a variavel libido como 
salda e usando as variaveis dummies (auxilia- 
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res) dummyl e dummy2 como variaveis pre- 
visoras (deixe todas as opgoes por padrao). A 
ANOVA principal para o modelo e a mesma 
de quando o codigo das variaveis auxiliares 
(i dummies ) foram utilizados; contudo, os coe- 
ficientes de regressao agora sao outros. 

A Saida 8.2 do SPSS mos- 
tra os resultados dessa regres¬ 
sao. Observe que o intercepto e 
a media geral, 3,467 (viu, eu 
nao estou mendndo!). Segun- 
do, o coeficiente da regressao para o contraste 
1 e um tergo da diferenga entre a media das 
condicoes experimentais e a condicao de con- 
trole (veja a seguir). Finalmente, o coeficiente 
da regressao para o segundo contraste e meta- 
de da diferenga entre as medias dos grupos-ex- 
perimentais (veja a seguir). Assim, quando 
uma comparagao planejada e realizada na 
ANOVA, um teste 1 e conduzido comparando a 
media de uma porgao da variacao com a media 
de uma porgao diferente. A partir das signifi¬ 
cances dos testes t podemos ver que nossos 
grupos-experimentais foram significativamen- 
te diferentes do grupo-controle (p < 0,05), mas 
que os grupos-experimentais nao foram signi- 
ficativamente diferentes (p > 0,05). 


8.2.10.3 Comparagoes nao-ortogonais © 

Gastei bastante tempo explicando como 
projetar comparagoes ortogonais apropriadas 
sem mencionar as possibilidades oferecidas 
pelos contrastes nao-ortogonais. Contrastes 


nao-ortogonais sao comparagoes que estao de 
alguma forma relacionadas e a melhor maneira 
de obte-los e desobedecendo a regra numero 1 
da segao anterior. Utilizando a minha analogia 
do bolo, nas comparagoes nao-ortogonais fa- 
tiamos o bolo e tentamos manter as fatias no- 
vamente juntas! Para o conjunto de dados do 
Viagra, por exemplo, um conjunto de contras¬ 
tes nao-ortogonais pode ter o mesmo contraste 
inicial (comparando os grupos-experimentais 
contra o grupo-controle), mas depois compara o 
grupo de baixa dosagem com o grupo-placebo. 
Isso viola a regra 1 porque o grupo-placebo esta 
sozinho no primeiro contraste e foi utilizado 
novamente no segundo contraste. Os codigos 
para esse conjunto de contrastes sao mostrados 
na Tabela 8.5; olhando para a ultima coluna fica 
claro que quando voce multiplica e soma os co- 
digos dos contrastes a soma nao da zero. Isso 
mostra que os contrastes nao sao ortogonais. 

Nada existe de in- 
trinsecamente errado em 
utilizarmos contrastes 
nao-ortogonais. Contu¬ 
do, se voce escolher esse 
tipo de procedimento 
deve tomar muito cuida- 
do em como ira interpre¬ 
tar os resultados. Com 
contrastes nao-ortogonais as comparagoes fei- 
tas estao relacionadas, assim, a estatistica teste 
resultante e o valor p estao correlacionados de 
alguma forma. Desse modo, voce deve utilizar 
nfveis de probabilidade mais conservadores 



Saida 8.2 do SPSS 


Coefficients a (Coeficientes) 



Unstandardized 
Coefficients (Coeficientes 
nao-padronizados) 

Standardized Coefficients 
(Coeficientes padronizados) 



Model (Modelo) 

B 

Std. Error 
(Erro padrao) 

Beta 

t 

Sig. 

1 (Constant) (Constante) 

3.467 

0.362 


9.574 

0.000 

Dummy Variable 1 (Variavel 
auxiliar 1) 

0.633 

0.256 

0.525 

2.474 

0.029 

Dummy Variable 2 (Variavel 
auxiliary 2) 

0.900 

0.443 

0.430 

2.029 

0.065 


a. Dependent Variable: Libido (Variavel dependente: Libido) 
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Tabela 8.5 Contrastes nao-ortogonais para os dados do Viagra 


Grupo 

Variavel auxiliar 1 
(Contrasted 

Variavel auxiliar 2 
(Contrasted 

Produto Contraste, 
x Contraste 2 

Placebo 

-2 

-1 

2 

Baixa dosagem 

1 

0 

0 

Alta dosagem 

1 

1 

1 

Total 

0 

0 

3 


para aceitar que um dado contraste e signifi- 
cativo (veja a Segao 8.2.11). Por essa razao, 
recomendo que voce utilize comparagoes pla- 
nejadas ortogonais sempre que possivel. 

8.2.10.4 Contrastes padrao © 

Embora em geral voce projete seus proprios 
contrastes, existem contrastes especiais para 
certas situagoes. Alguns desses contrastes sao 
ortogonais enquanto outros nao. Muitos proce- 


dimentos no SPSS permitem que voce execute 
os contrastes mencionados nessa secao. 

A Tabela 8.6 mostra os contrastes que es- 
tao disponiveis no SPSS para procedimentos 
tais como a regressao logfstica (veja a Secao 
6.4.3), a ANOVA fatorial e a ANOVA de medi- 
das repetidas (veja os Capitulos 9 e 10). Embo¬ 
ra os codigos exatos nao sejam fornecidos na 
Tabela 8.6, exemplos das comparagoes sao fei- 
tos com as situagdes de tres e de quatro grapos 
(onde os grupos sao rotulados de 1, 2 e 3 e 1,2, 


Tabela 8.6 Contrastes padrao disponiveis no SPSS 
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3 e 4, respectivamente). Quando voce codifica 
uma variavel no editor de dados, o SPSS ira 
tratar o codigo de menor valor como o grupo 1, 
o proximo mais alto como grupo 2 e assim su- 
cessivamente. Portanto, dependendo de quais 
comparagoes quer realizar, voce deve codificar 
a variavel de codigo de modo apropriado (e 
entao utilizar a Tabela 8.6 como um guia so- 
bre quais comparagoes o SPSS ira fazer). Os 
leitores espertos podem ter notado que alguns 
contrastes na Tabela 8.6 sao ortogonais (os de 
Helmert e os contrastes diferengas) enquanto 
outros nao sao ortogonais (desvios, simples e 
repetidos). Voce tambem pode ter notado que 
as comparagoes calculadas utilizando contras¬ 
tes simples sao as mesmas obtidas pela utiliza- 
gao das variaveis auxiliares na Tabela 8.2. 

8.2.10.5 Contrastes polinomiais: analise da 
tendencia © 

Um tipo de contraste deliberadamente 
omitido na Tabela 8.6 e o polinomial. Esse 
contraste testa tendencias nos dados e na sua 
forma mais basica ele procura por tendencias 
lineares (isto e, se a media dos grupos aumen- 




Grupo (Tendencia Cubical 


ta de forma proporcional). Contudo, existem 
tendencias mais complexas - como a quadra- 
tica, cubica e quartica - que tambem podem 
ser examinadas. A Figura 8.6 mostra diagra- 
mas de tipos de tendencia que podem existir 
em um conjunto de dados. A tendencia linear 
representa uma mudanga proporcional no va¬ 
lor da variavel dependente ao longo de catego- 
riais ordenadas. Uma tendencia quadratica 
e quando existe uma mudanga na diregao de 
uma linha (por exemplo, a linha e curva em 
um lugar). Um exemplo disso e quando um 
medicamento melhora o desempenho em uma 
tarefa no imcio, mas a medida que a dose au- 
menta o desempenho volta a cair. E obvio que 
para achar uma tendencia quadratica sao ne- 
cessarios pelo menos tres grupos (porque na 
situagao de dois grupos nao existem categorias 
suficientes da variavel independente para que 
as medias da variavel dependente mudem de 
uma forma e depois de outra). Uma tendencia 
cubica e quando existem duas mudangas na 
diregao da tendencia. Por exemplo, a media da 
variavel dependente primeiro aumenta com as 
primeiras categorias da variavel independente, 
depois ao longo de outras categorias as me- 




Figura 8.6 Tendencias linear, quadratica, cubica e quartica em cinco grupos. 
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dias diminuem, mas nas ultimas categorias as 
medias se elevam novamente. Para ter duas 
mudancas na diregao da media voce deve ter 
pelo menos quatro categorias da variavel inde- 
pendente. A ultima tendencia com a qual voce 
pode se deparar e a quartica, que apresenta 
tres mudancas de diregao (portanto, serao ne- 
cessarias pelo menos cinco categorias da va¬ 
riavel independente). 

Tendencias polinomiais devem ser exami- 
nadas em conjuntos de dados em que faz sen- 
tido ordenar as categorias da variavel indepen¬ 
dente (por exemplo, se voce administrou cinco 
doses de uma droga, faz sentido examinar as 
cinco doses na sua ordem de magnitude). Para 
os dados do Viagra existem somente tres gru- 
pos, desse modo, podemos esperar encontrar 
somente uma tendencia linear ou quadratica 
(e nao teria sentido testar para tendencias de 
ordens mais altas). 

Cada uma dessas tendencias apresenta um 
conjunto de codigos para as variaveis auxilia- 
res no modelo de regressao, portanto, faremos 
o mesmo que foi feito para os contrastes pla- 
nejados exceto que os codigos ja foram es- 
colhidos para representar o tipo de tendencia 
de interesse. De fato, os diagramas na Figura 
8.6 foram constrm'dos tragando os valores dos 
codigos para os cinco grupos. Na verdade, se 
voce adicionar codigos para uma dada tenden¬ 
cia, a soma sera igual a zero, e se os codigos 
forem multiplicados voce vai encontrar que a 
soma dos produtos tambem sera igual a zero. 
Dessa forma, esses contrastes sao ortogonais. 
A vantagem desses contrastes e que nao e ne- 
cessario construir uma codificagao propria, 
pois esses codigos ja existem. 

8.2.11 Procedimentos post hoc © 

Frequentemente, voce nao tem previsoes 
especfficas a priori sobre os dados coletados e, 
em vez disso, esta interessado em explorar os 
dados para verificar a existencia de quaisquer 
possfveis diferengas entre medias. Esse proce- 
dimento e, as vezes, denominado mineragdo 
de dados ou analise de dados exploratoria. Eu 
acho que esses dois termos tem uma conotagao 
de “manipulagao” dos dados e prefiro pensar 


nesses procedimentos como “encontrar as di¬ 
ferengas que eu teria previsto se fosse esperto 
o suficiente”. 

Testes post hoc consistem em compa¬ 
ragoes em pares planejadas para comparar 
todas as diferentes combinagoes dos grupos 
sendo testados. Assim, e como tomar todos os 
pares de grupos possfveis e executar um tes¬ 
te t em cada um. Pode parecer idiota explicar 
isso (mas eu sou um pouco idiota) conside- 
rando o que eu ja disse sobre o problema do 
crescimento do erro de conjunto. Contudo, as 
comparagoes aos pares controlam o erro de 
conjunto corrigindo o nfvel de significance de 
cada teste de forma que o erro do Tipo I total 
(a) ao longo de todas as comparagoes perma- 
nega ao nfvel especificado (0,05). Existem va- 
rias formas de controlar o erro de conjunto. A 
mais popular (e mais facil) e dividir o valor de 
a pelo niimero de comparagoes, assegurando, 
dessa forma, que o erro do Tipo I acumulado 
fique abaixo do valor especificado (0,05). Por¬ 
tanto, se forem executados 10 testes, utiliza- 
mos 0,005 como nosso criterio de significan¬ 
cia. Esse metodo e conhecido como corregao 
de Bonferroni em homenagem a Carlo Bon- 
ferroni (Figura 8.7). Existe uma contrapartida 
no controle da taxa de erro de conjunto que e a 
perda de poder estatfstico. Isso quer dizer que 
a probabilidade de rejeitar um efeito que exis¬ 
te aumenta (o erro do Tipo II). Se formos con- 
servadores na taxa de erro do Tipo I para cada 
comparagao, aumentamos a chance de deixar 
passar uma diferenga genufna nos dados. 

Contudo, quando consideramos procedi¬ 
mentos post hoc precisamos levar em conta 
tres coisas: (1) o teste controla a taxa de erro 
do Tipo I; (2) o teste controla a taxa de erro do 
Tipo II (isto e, o teste apresenta um bom poder 
estatfstico); e (3) o teste e confiavel quando as 
suposigoes da ANOVA sao violadas? 

Eu adoraria discutir todos os detalhes te- 
diosos dos tipos de testes post hoc, mas nao ha 
razao para tanto. Existem alguns textos exce- 
lentes disponfveis para quern quer saber mais 
(por exemplo, Toothaker, 1993; Klokars e 
Sax, 1986) e o SPSS tambem fornece 18 tipos 
de teste post hoc, portanto, eu teria que des- 
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Figura 8.7 Carlo Bonferroni, antes que a fama 
da sua corregao o levasse a bebida, as drogas e 
ao fanatismo pela estatistica. 


cedimento ENK (Estudentizado de Newman- 
Keuls) tambem e um teste bastante liberal e 
nao controla o erro de conjunto. Os testes de 
Bonferroni e Tukey controlam a taxa de erro 
do Tipo I muito bent, mas sao testes conser- 
vadores (eles tem poder estatfstico deficiente). 
O de Bonferroni apresenta um poder maior 
quando o numero de comparagoes e pequeno, 
ja o de Tukey e mais poderoso quando testa 
uma grande quantidade de medias. O teste de 
Tukey geralmente tem um poder maior do que 
os testes de Dunn e Scheffe. O procedimento 
de Ryan, Einot, Gabril e Welsch Q (REGWQ) 
apresenta um bom poder e um controle sa- 
tisfatorio do erro do Tipo I. De fato, quando 
queremos testar todos os pares de medias 
esse procedimento e provavelmente o melhor. 
Contudo, quando os tamanhos dos grupos sao 
diferentes, esse procedimento nao devera ser 
utilizado. 



matar muitos quilometros de floresta para ex- 
plica-los. O importante e que voce saiba quais 
testes post hoc executam melhor de acordo 
com os tres criterios mencionados acima. 

8.2.11.1 Procedimentos posf hoc e erros 
do Tipo I (ct) e Tipo II (ft) © 

A taxa de erro do Tipo I e o 
poder estatfstico de um teste es- 
tao conectados. Portanto, existe 
sempre uma contrapartida: se o 
teste e conservador (a probabi- 
lidade de erro do Tipo I e pequena), e provavel 
que ele tenha um baixo poder estatfstico (a pro- 
babilidade de erro do Tipo II sera alta). Assim, e 
importante que os procedimentos de compara¬ 
goes multiplas controlem a taxa de erro do Tipo 
I, mas sem uma perda substancial no poder. Se 
um teste e muito conservador, provavelmente 
iremos rejeitar diferengas entre medias que sao, 
na realidade, significativas. 

A comparagao de pares MDS (Menor 
Diferenga Significativa) (LDS - Least-Signifi¬ 
cant Difference ) nao tenta controlar o erro do 
Tipo lee equivalente a execugao de multiplos 
testes t. A unica diferenga e que a MDS requer 
que a ANOVA global seja significativa. O pro- 


8.2.11.2 Procedimentos post hoc e 

violapoes das hipoteses do teste © 

A maioria das pesquisas sobre testes post 
hoc tem se debrugado no problema do desem- 
penho do teste quando os tamanhos dos gru¬ 
pos sao diferentes (delineamento desbalan- 
ceado), quando as variancias das populagoes 
sao muito distintas e quando os dados nao sao 
normalmente distribufdos. A boa notfcia e que 
muitos procedimentos de comparagoes multi¬ 
plas tem um bom desempenho sob pequenos 
desvios da normalidade. A ma notfcia e que 
elas apresentam um mau desempenho quando 
os tamanhos dos grupos sao diferentes e quan¬ 
do as variancias populacionais sao desiguais. 

O teste GT2 de Hochberg 
e de Gabriel foram projetados 
para lidar com situagoes em 
que os tamanhos amostrais sao 
diferentes. O procedimento de 
Gabriel e geralmente mais poderoso, mas pode 
se tornar muito liberal quando os tamanhos das 
amostras sao bem diferentes. O GT2 de Hoch- 
bert nao e confiavel quando as variancias po¬ 
pulacionais sao diferentes e deve ser utilizado 
somente quando voce estiver seguro de que 
esse nao e o caso. Existem varias comparagoes 
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multiplas especialmente projetadas para situa¬ 
tes em que as variancias populacionais dife- 
rem. 0 SPSS fornece quatro opgoes para essa 
situacao. O T2 de Tamhane, T3 de Dunnett, 
Games-Howell e C de Dunnett. O T2 de Ta¬ 
mhane e conservador e o C e T3 de Dunnett 
mantem um controle muito rigido do erro do 
Tipo I. O procedimento de Games-Howell e o 
mais poderoso, mas pode ser liberal quando os 
tamanhos das amostras forem pequenos. Con- 
tudo, o de Games-Howell e mais preciso quan¬ 
do os tamanhos amostrais sao diferentes. 

8.2.11.3 Resumo dos Procedimentos posf 
hoc © 

A escolha dos procedimentos de compa- 
ragoes multiplas ira depender da situacao que 
voce tiver e se o mais importante e manter um 
controle restrito sobre o erro de conjunto ou ter 
um grande poder estatfstico. Contudo, algumas 
orientacdes gerais podem ser colocadas (veja 
Toothaker, 1993). Quando os tamanhos das 
amostras sao iguais e voce tern certeza de que 
as variancias populacionais sao semelhantes, 
utilize o REGWQ ou Tukey, pois ambos tern 
um bom poder e um bom controle sobre o erro 
do Tipo I. O teste de Bonferroni e geralmente 
conservador, mas se voce quer garantia sobre 
a taxa de erro do Tipo I, deve utiliza-lo. Se os 
tamanhos amostrais sao levemente diferentes, 
use o procedimento de Gabriel porque ele tern 
um grande poder, mas se os tamanhos amos¬ 
trais sao muito diferentes, o recomendavel e o 
GT2 de Hochberg. Se voce tern duvidas quanto 
a igualdade das variancias populacionais, utili¬ 
ze o procedimento de Games-Howell porque 
ele oferece, em geral, o melhor desempenho. 
Recomendo que voce execute o procedimento 
de Games-Howell junto com qualquer outro 
teste que voce possa ter selecionado, em vir- 
tude da incerteza em relacao a igualdade das 
variancias populacionais. 

Embora essas orientacoes gerais fornecam 
um guia a ser seguido, fique atento a outros 
procedimentos disponlveis e quando eles po¬ 
dem ser uteis (por exemplo, o teste de Dunnett 
e a unica comparagao multipla que permite que 
voce teste medias contra uma media controle). 


8.3 REALIZANDO A ANOVA DE UM 
FATOR (ONE-WAY) NO SPSS © 

Espero que voces gostem da teoria por tras 
da ANOVA, pois vamos coloca-la em pratica 
executando uma ANOVA com os dados do Via¬ 
gra. Como ocorreu com o teste t independente, 
precisamos entrar com os dados no editor uti- 
lizando uma variavel de codigo para especifi- 
car a qual dos tres grupos os dados pertencem. 
Assim, os dados devem ser dispostos em duas 
colunas (uma denominada dose que especifica 
quanto Viagra um dado participante tomou, e 
outra denominada libido que indica a libido 
da pessoa na semana seguinte). Os dados estao 
no arquivo Viagra.sav, mas eu recomendo que 
voce os digite para praticar a entrada de dados. 
Codifiquei a variavel de grupo de modo que 1 
= placebo, 2 = baixa dosagem e 3 = alta dosa- 
gem (veja a Segao 2.4.4). 

Para realizar uma ANOVA de um fator, 
precisamos primeiro acessar a caixa de dia- 
logo principal utilizando o caminho de menu 
Analyzes Compare Means=>One-way Ano- 
va (Analisar=>Comparar medias=> AN OVA 
de um fator) (Figura 8.8). Essa caixa de dia- 
logo apresenta um espago onde voce pode lis- 
tar uma ou mais variaveis dependentes e um 
segundo espago para especificar a variavel de 
grupo ou fator. Fator e outro termo para a va¬ 
riavel independente e nao deve ser confundido 
com os fatores que serao apresentados quando 
voce aprender sobre analise de fatores. Uma 
coisa que eu nao gosto no SPSS e que em va- 
rios procedimentos, tais como a ANOVA de 
um fator, o programa estimula o usuario a exe- 
cutar multiplos testes, o que, como vimos, nao 
e recomendavel. Por exemplo, nesse procedi¬ 
mento voce pode especificar diversas variaveis 
dependentes nas quais conduzir diferentes 
ANOVAs. Na verdade, se voce tivesse medido 
diversas variaveis dependentes (digamos que 
voce tivesse medido nao apenas a libido, mas 
a excitagao psicologica e a ansiedade tambem) 
seria preferfvel analisar esses dados utilizando 
a MANOVA em vez de tratar cada medida de- 
pendente de forma separada (veja o Capitulo 
14). Para os dados do Viagra precisamos se- 
lecionar somente libido da lista de variaveis 
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Figura 8.8 Caixa de dialogo principal para a ANOVA de um fator. 


e transferi-la para o quadro denominado De¬ 
pendent List (Lista Dependente) clicando em 
► . Selecione entao a variavel de grupo dose e 
transfira-a para o quadro denominado Factor 
(Fator) clicando em ► . 

8.3.1 Comparagoes planejadas utilizando 
o SPSS © 

Se voce clicar em y .s (Contrastes), vai 

acessar a caixa de dialogo que permite fazer 
as comparagoes planejadas descritas na Se¬ 
gao 8.2.10. 

Essa caixa de dialogo e mostrada na Fi¬ 
gura 8.9 e ela apresenta duas segoes. A pri- 
meira segao serve para realizar uma analise 
de tendencia. Se voce quer testar alguma ten¬ 
dencia nos dados, marque o espago denomi¬ 
nado Polynomial (Polinomial). Depois de 



Figura 8.9 Caixa de dialogo para realizar com¬ 
paragoes planejadas. 


marca-lo, selecione o grau do polinomio dese- 
jado. Os dados do Viagra apresentam somente 
tres grupos e assim o maior grau de tendencia 
que pode ser identificado e o quadratico (veja 
a Segao 8.2.10.3). Para realizar uma analise de 
tendencia, e importante que voce tenha codi- 
ficado a variavel de grupo de uma forma sig- 
nificativa. Assim, esperamos que a libido seja 
menor no grupo-placebo, aumente no grupo 
de baixa dosagem e aumente novamente no 
grupo de alta dosagem. Para detectar uma ten¬ 
dencia que faga sentido, e necessario ter codi- 
ficado esses grupos em uma ordem crescente. 
Fizemos isso codificando o grupo-placebo 
com o valor 1, o grupo de baixa dosagem com 
o valor 2 e o grupo de alta dosagem com o 
valor 3. Se tivessemos codificado os grupos de 
uma forma diferente, isso influenciaria tanto a 
tendencia a ser detectada quanto se ela fosse 
estatisticamente significativa. 

Para 
os dados 
do Viagra 
existem 

somente tres grupos, assim, devemos selecionar 
a opgao polinomial Pl " *2*1, e depois selecionar 
o grau quadratico (dois) clicando em _l! e entao 
selecionando a opgao Quadratic (Quadratica). 
Se a tendencia quadratica for selecionada, o 
SPSS ira testar tanto essa opgao quanto a linear. 

A parte inferior da caixa de dialogo seme- 
lhante a da Figura 8.9 serve para especificar 
qualquer comparagao planejada. Para fazer 
isso, precisamos informar ao SPSS quais pon- 
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deragoes ele deve atribuir para cada grupo. O 
primeiro passo e decidir quais comparacoes 
queremos fazer e entao quais pesos devem 
ser atribufdos a cada grupo para cada um dos 
contrastes. Ja vimos esse processo na Segao 
8.2.10.2, assim, sabemos que os pesos para o 
primeiro contraste sao —2 para o grupo-pla- 
cebo, 1 para o grupo de baixa dosagem e 
novamente 1 para o grupo de alta dosagem. 
Iremos especificar esse contraste primeiro. E 
importante estar seguro de que o peso correto 
seja atribufdo para cada grupo, desse modo, 
voce deve lembrar que o primeiro peso atri- 
but'do deve ser a ponderagao do primeiro gru¬ 
po (isto e, o grupo codificado com o menor 
valor no editor de dados). Para os dados do 
Viagra, o grupo codificado com o menor valor 
e o placebo (que tern o codigo 1) e devemos 
entrar com a ponderagao para esse grupo pri¬ 
meiro. Clique no espago denominado Coeffi¬ 
cients (Coeficientes) com o mouse e digite 
“-2” e clique em (Adicionar). O passo 
seguinte e entrar com a ponderagao para o se- 
gundo grupo, que para os dados do Viagra e 
o grupo de baixa dosagem (porque esse gru¬ 
po esta codificado no editor com o segundo 
valor mais alto). Clique novamente no espago 
denominado Coefficients (Coeficientes) com 
o mouse e digite ‘T’clicando em seguida em 
M (Adicionar). Finalmente, devemos entrar 
com a ponderagao do ultimo grupo que, para 
os dados do Viagra, e o grupo de alta dosagem 
(no editor esse grupo foi codificado com o va¬ 
lor mais alto). Clique em Coefficients (Coe¬ 
ficientes) com o mouse e digite “1” e, depois, 
clique em **■ (Adicionar). O resultado deve 
ser semelhante ao da Figura 8.10. 

Uma vez que os pesos foram atribufdos 
voce podera alterar ou remover qualquer um 
deles utilizando o mouse para selecionar a 
ponderagao que quer mudar. O peso ira apa- 
recer no espago denominado Coefficients 
(Coeficientes), onde voce podera digitar o 
novo valor e entao clicar em p*"* (Mudar). Al- 
ternativamente, voce pode clicar em qualquer 
um dos pesos e remove-lo completamente cli- 
cando em (Remover). Utilizando as pon- 
deragoes, o SPSS calcula o coeficiente total 



Figura 8.10 Caixa de dialogo dos contrastes 
completada para o primeiro contraste para os 
dados do Viagra. 


que, como vimos na Segao 8.2.10.2, deve ser 
igual a zero. Se esse coeficiente for qualquer 
outro valor que nao zero, voce deve retornar e 
verificar se todas as regras para a atribuigao de 
pesos foram seguidas. 

Uma vez que voce tenha especificado o 
primeiro contraste, clique em t* 9l<t (proxi¬ 
mo). Os pesos que voce recem digitou desa- 
parecerao e a caixa de dialogo estara pronta 
para a entrada do segundo contraste que, nesse 
caso, e o ultimo contraste. Sabemos da Segao 
8.2.10.2 que os pesos para o segundo contras¬ 
te foram: 0 (para o grupo-placebo), +1 para o 
grupo de baixa dosagem e — 1 para o grupo de 
alta dosagem. Podemos especificar esse con¬ 
traste da mesma forma que antes. Fembrando 
que a primeira ponderagao a ser entrada e a 
do grupo-placebo, devemos entrar o valor 0 
como a primeira ponderagao. Clique no es¬ 
pago denominado Coefficients (Coeficientes) 
com o mouse e digite “0” e clique em **■ 
(Adicionar). A seguir precisamos entrar com 
a ponderagao para o grupo de baixa dosagem 
clicando novamente no espago Coefficients 
(Coeficientes), digitando “1” e clicando em 
(Adicionar). Finalmente, sera adiciona- 
da a ponderagao para o grupo de alta dosagem 
da mesma forma so que agora com o cuidado 
de digitar o valor “-1”. O resultado deve ser 
uma caixa de dialogo semelhante a da Figura 
8.11. Note que a soma dos pesos e zero, como 
ocorreu com o contraste 1. Fembre-se de en- 
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Figura 8.11 Caixa de dialogo dos contrastes 
preenchida para o segundo contraste para os 
dados do Viagra. 


trar com o peso 0 para qualquer grupo que nao 
estiver no contraste. Quando todos os contras¬ 
tes planejados tiverem sido especificados, cli¬ 
que em (Continuar) para retornar a caixa 
de dialogo principal. 

8.3.2 Testes Post Hoc no SPSS © 

Depois de informar ao SPSS quais as com- 
paragoes planejadas a serem feitas, podemos 
escolher realizar testes post hoc. Teoricamen- 
te, se fizemos as comparagoes planejadas nao 
precisamos realizar testes post hoc (porque as 
hipoteses de interesse ja foram testadas). Da 
mesma forma, se tivessemos escolhido reali¬ 
zar testes post hoc nao seria necessario fazer os 


contrastes planejados (porque nao temos hipo¬ 
teses para testar). Contudo, para poupar espa- 
go, iremos realizar alguns testes post hoc para 
os dados do Viagra. Clique em p ° 11 na caixa 
de dialogo principal para acessar a caixa de 
dialogo para os testes post hoc (Figura 8.12). 


Na Segao 

W DunneU 


H 

8.2.11.3, re- 

Control Category 

| Last 

comendei va- 

Tesl 


Control 

rios procedi- 

2-sided r < Qfinbc 

>1 f > 


mentos post hoc para varias situagoes. Para os 
dados do Viagra, os tamanhos das amostras 
sao iguais e nao existe necessidade de realizar 
o teste de Gabriel. Devemos utilizar o teste de 
Tukey e o REGWQ e checar os resultados 
com o procedimento de Games-Howell. Te¬ 
mos uma hipotese especifica que tanto o gru¬ 
po de alta dosagem quanto o de baixa dosa- 
gem devem diferir do grupo-placebo e assim 
podemos utilizar o teste de Dunnett para exa- 
minar essas hipoteses. Uma vez que voce te- 
nha selecionado o teste de Dunnett, voce pode 
mudar a categoria de controle (o padrao e uti¬ 
lizar a ultima categoria) para especificar que a 
primeira categoria sera utilizada como catego¬ 
ria de controle (porque o grupo-placebo foi 
codificado com o valor mais baixo). Voce 
pode, tambem, escolher se ira realizar um tes¬ 
te do tipo bilateral (<r 2 -«*i) ou unilateral. Se 
voce escolher o teste unilateral, deve prever se 
voce acredita que a media do grupo-controle 
sera menor do que a media de um grupo-expe- 



Figura 8.12 Caixa de dialogo para especificar testes post hoc. 
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rimental em particular (rio^i) ou maior do 
que a media de um grupo-experimental em 
particular (<~>a|g§). Esses sao todos os testes 
post hoc que voce necessita especificar e 
quando a caixa de dialogo estiver completa ela 
devera ser semelhante a da Figura 8.12. Cli¬ 
que em (continuar) para voltar a caixa de 
dialogo principal. 

8.3.3 Opgoes © 

As opgoes para a ANOVA de um fator sao 
bem simples. Primeiro voce pode solicitar es- 
tatfsticas descritivas, o que ira produzir uma 
tabela de medias, desvios padrao, erros padrao, 
amplitudes e intervalos de confianga para as 
medias de cada grupo. Essa e uma opgao util, 
pois podera auxiliar na interpretagao dos resul- 
tados finais. Uma opgao crucial a ser seleciona- 
da e o teste de homogeneidade das variancias. 
Como ocorre com os testes t, ha uma suposigao 
de que as variancias dos grupos sao iguais e 
selecionando essa opgao essa hipotese e testa- 
da. O SPSS utiliza o teste de Levene, que testa 
a hipotese de que as variancias de cada grupo 
sao iguais (veja a Segao 3.6). Se a hipotese de 
homogeneidade das variancias for violada, o 
SPSS oferece duas versoes alternativas da ra- 
zao F: a de Brow-Forsythe (1974) e a de Welch 
(1951). Essas duas estatlsticas sao discutidas 
no Quadro 8.3 (e, se voce esta realmente ente- 
diado, olhe o arquivo WelchF.pdf no site www. 
artmed.com.br), mas e suficiente dizer que elas 
devem ser selecionadas apenas como garantia 
para o caso de a hipotese ser violada. 

Existe, tambem, a opgao de ter um dia- 
grama das medias (selecionar a opgao Means 
plot) (Figura 8.13). Se essa opgao for sele- 
cionada, um diagrama de linha do grupo de 
medias sera apresentado na salda. Finalmen- 
te, as opgoes nos deixam especificar se que- 
remos excluir casos na base listwise ou em 
uma base per analysis. Essa opgao e util se 
voce esta realizando varias ANOVAS com 
diferentes variaveis dependentes. A primeira 
opgao (Exclude cases analysis by analysis) 
(Excluir casos analise por analise) exclui 
qualquer caso que tiver um valor faltando 
(missing) tanto para a variavel independente 



Figura 8.13 Opgoes para a ANOVA de um fator. 


quanto para a variavel dependente utilizadas 
nessa analise em particular. A opgao Exclu¬ 
de cases listwise (Excluir casos por lista) 
excluira de todas as analises qualquer caso 
que tenha um valor faltando para a variavel 
independente ou qualquer variavel dependen¬ 
te especificada. Assim, se voce se acostumar 
a nao realizar centenas de ANOVAs em di¬ 
ferentes variaveis (veja o Capitulo 14 sobre 
MANOVA) os valores padrao serao adequa- 
dos. Quando voce tiver selecionado as opgoes 
apropriadas, clique em c “"’— (continuar) para 
retornar a caixa de dialogo principal e clique 
em <* para rodar a analise. 

8.4 SAIDAS DA ANOVA DE UM FATOR 
(ONE WAY) © 

8.4.1 Saidas para a analise principal © 

Se voce carregar os dados do Viagra (ou 
digita-los) e selecionar todas as opgoes que eu 
sugeri, devera verificar que a safda sera seme¬ 
lhante a que segue. Se a sua safda for diferente 
nao se assuste porque um de nos fez algo erra- 
do - espero que nao eu. A Figura 8.14 mostra 
um diagrama de barras de erro dos dados do 
Viagra com uma linha superposta para apresen- 
tar a tendencia geral das medias ao longo dos 
grupos. Esse grafico nao e automaticamente 
produzido pelo SPSS; contudo, um diagrama 
de linha sera produzido se a opgao Means plot 
(Representar medias) for selecionada (esse gra- 
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Quadro 8.3 


O que eu faco na ANOVA quando a hipotese da homogeneidade das 
variancias e violada? © 

Na Segao 8.2.9.1, mencionei que quando os tamanhos dos grupos sao desi- 
guais, violagoes na hipotese de homogeneidade das variancias podem ter serias 
consequencias. 0 SPSS incorpora opgoes para duas razoes F, que foram proje- 
tadas para serem mais robustas caso a homogeneidade das variancias nao seja 
valida. A primeira e a razao F de Brown e Forsythe (1974), que e bem facil de 
explicar. Relatei anteriormente que quando os tamanhos dos grupos sao dife- 
rentes e os grupos maiores apresentam as maiores variancias, isso introduz um vies na razao F, 
que tende a ser mais conservadora. Se voce voltar a equagao (8.7), isso ficara claro, pois para 
calcular SS R as variancias sao multiplicadas pelos seus tamanhos amostrais (menos 1), assim, 
nessa situagao obteremos um grande tamanho amostral multiplicado por uma grande variancia 
que ira inflar o valor do SS R . Que efeito isso vai causar na razao F? Bem, a razao F e proporcional 
a SS M /SS R , desse modo, se SS R e grande, entao a razao F sera pequena (o motivo para ser mais 
conservadora: seu valor esta sendo reduzido demaisl). Brown e Forsythe contornaram esse pro¬ 
blems ponderando as variancias dos grupos, nao pelos seus tamanhos amostrais, mas pelo in- 
verso dos seus tamanhos amostrais (na verdade, eles utilizam n/N, o tamanho da amostra como 
uma proporgao do tamanho total das amostras). Isso signifies que o impacto de grandes tama¬ 
nhos amostrais com grandes variancias sera reduzido: 

_ SS M _ SS M 

BF ss Rbf £,*(!->) 

Assim, para os dados do Viagra, a SS M e a mesma de antes (20,135), dessa forma, a equagao 
fica: 

„ 20,135 

Jr =-- 

BF 2 ,, “grnpoK „2 n "grupo2 , 2 /I n gnipo3 ,. 

“'grupol v A ft ) I 1> giupo2V A ft / ' ‘ > grupo3v 1 ft ' 

_ _ 20,135 _ 

1,70(1 - , 5 5 ) | 1,70(1 , 5 J ) + 2,50(1 - , 5 5 ) 

_ 20,135 
_ 3,933 
= 5,119 

Essa estatistica e avaliada utilizando os graus de liberdade do modelo e dos termos erro. 
Para o modelo, o gl M e o mesmo de antes (isto e, k - 1 =2), mas e feito um ajuste nos graus de 
liberdade dos residuos, gl R . Os calculos desse valor bem como do F de Welch (1951) estao alem 
dos objetivos deste livro, mas se voce estiver interessado consulte o apendice A.5 (ou o arquivo 
WelchF.pdf no site www.artmed.com.br), que detalha o F de Welch. Tenham em mente que essas 
duas tecnicas fazem ajustes no F e nos graus de liberdade dos residuos com o proposito de com- 
bater os problemas originados da violagao da hipotese da homogeneidade das variancias. 

A pergunta obvia e qual dos dois procedimentos e melhor. Tomarken e Serlin 
(1986) revisaram essas e outras tecnicas e concluiram que ambas controlam 
bem a taxa de erro do Tipo I (isto e, quando nao existem efeitos na populagao 
voce, de fato, obtem um F nao-significativo). Contudo, em termos de poder (isto 
e, qual teste e melhor para detectar um efeito quando ele existe), o teste de 
Welch parece se comportar melhor exceto quando existe uma media extrema 
com uma grande variancia. 
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Figura 8.14 Diagrama de barras de erros para os dados do Viagra. 


fico sera parecido com o da Figura 8.14, mas 
sem as barras de erros). Escolhi apresentar um 
diagrama de barras de erro porque ele e mais 
interessante que apenas o diagrama de linha. 
Fica claro a partir desse grafico que todas as 
barras de erro se sobrepoem, indicando que 
nao existem diferencas entre os grupos (embo- 
ra essa medida seja aproximada). A linha que 
une as medias indica uma tendencia linear no 
sentido de que a medida que a dose de Viagra 
aumenta, cresce tambem proporcionalmente o 
nivel medio da libido. 

A Saida do SPSS 8.3 mostra a tabela das 
estatisticas descritivas para o procedimento de 
um fator dos dados do Viagra. Observe que 
as medias e os desvios padrao correspondem 
aqueles mostrados na Tabela 8.1. Alem disso, 
o erro padrao e apresentado. Voce deve lembrar 
que o erro padrao e o desvio padrao da distri- 
buigao amostral desses dados (assim, para o 


grupo-placebo, se voce retirar muitas amostras 
da populagao da qual esses dados vieram, as 
medias dessas amostras terao um desvio pa¬ 
drao de 0,5831). Intervalos de confian^a para as 
medias tambem sao apresentados. Voce ja deve 
estar familiarizado com o que um intervalo de 
confianga nos informa: se tomarmos 100 amos¬ 
tras da popula$ao da qual o grupo-placebo foi 
retirado e construirmos intervalos de confian$a 
para as medias dessas amostras, 95 desses inter¬ 
valos irao conter a media da populacao. Em ou- 
tras palavras, e provavel que a media da popula- 
$ao esteja entre 0,5811 e 3,8189. Embora esses 
diagnostics nao sejam importantes agora, ire- 
mos nos referir a eles no decorrer da analise. 

A proxima parte da saida e uma tabela que 
resume o teste de Levene (Saida do SPSS 8.4). 
Esse teste e projetado para verificar a hipotese 
nula de que as variancias dos grupos sao iguais. 
Ele e uma ANOVA conduzida nas dilerenpas 
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Saida do SPSS 8.3 


Descriptives (Descritivas) 





Std. 

Std. 

95% Confidence Interval 
for Mean (Intervalo 
de Confianga de 95% 
para a Media) 




N 

Mean 

(Media) 

Deviation 

(Desvio 

Padrao) 

Error 

(Erro 

Padrao) 

Lower Bound 
(Limite 
Inferior) 

Upper Bound 
(Limite 
Superior) 

Minimum 

(Minimo) 

Maximum 

(Maximo) 

Libido Dose of Placebo 

5 

2.2000 

1.3038 

0.5831 

0.5811 

3.8189 

1.00 

4.00 

Viagra Low Dose 

5 

3.2000 

1.3038 

0.5831 

1.5811 

4.8189 

2.00 

5.00 

(Dosede (Baixa Do- 
Viagra) sagem) 
High 

5 

5.0000 

1.5811 

0.7071 

3.0368 

6.9632 

3.00 

7.00 

Dose (Alta 
Dosagem) 
Total 

15 

3.4667 

1.7674 

0.4563 

2.4879 

4.4454 

1.00 

7.00 


absolutas entre os dados observados e a media 
de onde os dados vieram. 4 Nesse caso, o teste de 
Levene esta, portanto, testando se as variancias 
dos tres grupos sao significativamente diferen- 
tes. Se o teste de Levene e significativo (isto e, o 
valor de Sig e menor do que 0,05), podemos di- 
zer que as variancias sao significativamente di- 
ferentes. Isso quer dizer que violamos uma das 
suposigoes da ANOVA e que devemos tomar 
algumas providencias para corrigir isso. Como 
vimos no Capftulo 3, uma forma comum de re- 
tificar diferengas entre as variancias dos grupos 
e transformar todos os dados: se as variancias 
sao diferentes, elas podem, as vezes, ser estabi- 
lizadas tomando-se a raiz quadrada de cada va¬ 
lor da variavel dependente e depois analisando 
novamente esses valores transformados (veja o 
Capftulo 3 e Howell, 2002, pp. 342-349). Con- 
tudo, dado a aparente utilidade do F de Welch e 
do F de Brown-Forsythe e o fato de que as trans- 
formagbes muitas vezes nao ajudam, voce pode 
relatar o F de Welch (e eu sugiro que isso seja 


4 O leitor interessado pode tentar fazer isso. Basta criar 
uma variavel denominada tliff (forma abreviada para di- 
feremja), que e cada escore subtraido da media do grupo 
a qual esse escore pertence. Depois, remova todos os 
sinais de menos (isto e, pegue os valores absolutos de 
diff) e realize uma ANOVA de um fator com dose como 
variavel independente e diff como variavel dependen¬ 
te. Voce ira verificar que a razao F para essa analise e 
0,092, que apresenta uma significancia p = 0,913! 


feito em vez do F de Brown-Forsythe a menos 
que voce tenha tambem uma media extrema que 
esteja causando problemas com a variancia). 
Felizmente, para esses dados as variancias sao 
parecidas (daf o alto valor da probabilidade); de 
fato, se voce observar a Saida 8.3 do SPSS vera 
que as variancias do grupo-placebo e do grupo 
de baixa dosagem sao identicas. 

Saida do SPSS 8.4 


Test of Homogeneity of Variances (Teste 
de homogeneidade das variancias) 



Levene Statistic 
(Estatistica de 
Levene) 

dfl 

(gii) 

df2 

(gi2) 

Sig. 

(Sig.) 

Libido 

0.092 

2 

12 

0.913 


A Saida do SPSS 8.5 mostra a tabela resu¬ 
mo da ANOVA principal. A tabela e dividida 
em efeitos entre os grupos (efeitos devidos ao 
modelo - o efeito experimental) e efeitos den- 
tro dos grupos (essa e a variagao assistemati- 
ca dos dados). O efeito entre grupos e depois 
dividido nas componentes linear e quadratica 
e esses componentes sao a analise de tenden- 
cia descrita na Segao 8.2.10.5. O efeito entre 
grupos denominado Combinado e o efeito 
experimental geral. Nessa linha sao informa- 
das as somas dos quadrados para o modelo 
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Saida do SPSS 8.5 


ANOVA 



Sum of Squares 
(Soma dos 
Quadrados) 

df 

(gi) 

Mean Square 
(Quadrados 
Medios) 

F 

Sig. 

(Sig.) 

Libido Betwen Groups (Combined) (Com- 

20.133 

2 

10.067 

5.119 

0.025 

(Entre Grupos) binado) 






Linear Trend (Ten- Contrast 

19.600 

1 

19.600 

9.966 

0.008 

dencia Linear) (Contraste) 






Deviation 

0.533 

1 

0.533 

0.271 

0.612 

(Desvios) 






Quadratic Trend Contrast 

0.533 

1 

0.533 

0.271 

0.612 

(Tendencia Qua- (Contraste) 






Withih Groups dratica) 

23.600 

12 

1.967 



(Dentre Grupos) 






Total 

43.733 

14 





(SS M = 20,13) e esse valor corresponde ao 
valor calculado na segao 8.2.5. Os graus de 
liberdade sao iguais a 2 e os quadrados me- 
dios para o modelo correspondent aos valores 
calculados na segao 8.2.7 (10,067). As somas 
dos quadrados e as medias dos quadrados re- 
presentam o efeito experimental. Esse efeito 
global e entao dividido porque solicitamos 
ao SPSS que fizesse lima analise de tenden- 
cia nos dados (iremos abordar novamente as 
tendencias no momenta devido). Como nao 
especificamos isso na Segao 8.3.1, essas duas 
linhas na tabela resumo nao serao produzidas. 
A linha rotulada de Within groups (dentro dos 
grupos) fornece detalhes da variagao nao-sis- 
tematica dentro dos dados (a variagao devido 
a diferengas naturais individuals na libido e 
as diferentes reagoes ao Viagra). A tabela nos 
informa quanta variagao assistematica existe 
(a soma dos quadrados residual, SS R ) e esse 
valor (23,60) corresponde ao valor calculado 
na Segao 8.2.6. A tabela fornece a quantidade 
media de variagao assistematica, a media dos 
quadrados (MS R ), que corresponde ao valor 
(1,967) calculado na Segao 8.2.7. O teste so- 
bre se as medias dos grupos sao as mesmas e 
representado pela razao F para os efeitos en- 
tre grupos combinados. O valor dessa razao e 
5,12, que e a mesma calculada na Segao 8.2.8. 
Finalmente, o SPSS informa a probabilidade 
de esse valor ter ocorrido por acaso. A colu- 
na final rotulada Sig. mostra a probabilidade 


da ocorrencia de uma razao F do tamanho da 
obtida por acaso. Nesse caso, existe uma pro¬ 
babilidade de 0,025 de que uma razao F des- 
se valor tenha ocorrido por acaso (isto e, uma 
chance de apenas 2,5%). Vimos em capitulos 
anteriores que os cientistas sociais utilizam 
um ponto de corte de 0,05 como criterio de 
significancia. Entao, em virtude do valor da 
significancia observada ser menor do que esse 
valor podemos dizer que existe um efeito sig¬ 
nificative do Viagra. 5 Contudo, nesse estagio 
nao sabemos exatamente qual foi o efeito do 
Viagra (nao sabemos quais grupos estao dife- 
rindo). E interessante notar aqui que obtemos 
um efeito experimental significativo embora 
nosso diagrama de barras de erros tenha indi- 
cado que nenhuma diferenga seria encontrada. 
Essa contradigao ilustra como o diagrama de 
barra de erros pode ser utilizado apenas como 
uma ilustragao grosseira dos dados. 

Sabendo que o efeito global do Viagra foi 
significativo, podemos agora observar a analise 


5 Uma pergunta que meus alunos geralmente fazem e: 
“a significancia da ANOVA e uni ou bilateral, e se ela 
e bilateral posso dividir o valor por 2 para obter o valor 
unilateral?”. A resposta e que para um teste unilateral 
voce deve fazer uma hipotese direcional (isto e, a me¬ 
dia para gatos e maior do que a dos caes). A ANOVA e 
um teste nao-especifico, assim, ela apenas informa ge- 
nericamente se existe uma diferenga ou nao e, porque 
existem varias medias, voce nao pode formular uma 
hipotese direcional. Desse modo, nao e valido dividir 
por dois o valor da significancia. 
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de tendencia. Essa analise divide o efeito expe¬ 
rimental para ver se ele pode ser explicado por 
um relacionamento linear ou quadratico. Primei- 
ro, vamos tentar uma componente linear. Essa 
comparagao testa se as medias crescem com os 
grupos de uma forma linear. Novamente a soma 
dos quadrados e a media dos quadrados sao for- 
necidas, mas o mais importante a ser notado e 
o valor da razao F e o valor correspondente da 
significance. Para a tendencia linear a razao 
F e 9,97 e esse valor e significativo a um nivel 
de 0,008. Portanto, podemos dizer que a medi- 
da que a dose de Viagra aumenta de nenhum 
Viagra para uma alta dose do medicamento, a 
libido cresce proporcionalmente. Na tendencia 
quadratica, essa comparagao e testar se o padrao 
das medias e curvilineo (isto e, representado por 
uma curva que tern uma curvatura). O grafico 
de barras de erros dos dados recomenda que as 
medias nao podem ser representadas por uma 
curva e os resultados para a tendencia quadra¬ 
tica confirmam isso. A razao F para a tendencia 
quadratica nao e significativa (de fato, o valor de 
F e menor do que 1. o que imediatamente indica 
que esse contraste nao sera significativo). 

Finalmente, a Saida do SPSS 8.6 mos- 
tra as razoes F de Welch e de Brow-Forsythe. 
Nao precisamos delas, pois o teste de Levene 
nao foi significativo, indicando que as varian- 
cias podem ser consideradas iguais. Contudo, 
quando a homogeneidade da variancia for vio- 
lada voce deve levar em conta esses valores 
em vez daqueles na tabela principal. Se voce 
estiver interessado em como esses valores sao 
calculados, verifique o Quadro 8.3 e o arquivo 
WelchF.pdf no site www.artmed.com.br. No 
entanto, sendo honesto, isso e bastante confuso 


Saida do SPSS 8.6 

Robust Tests of Equality of Means (Testes 
robustos de igualdade de medias) 


Libido 

Statistic a 
(Estatistica) 

dfl 

(gii) 

df2 

(gi2) 

Sig. 

(Sig.) 

Welch 

4.320 

2 

7.943 

0.054 

Brown- 

Forsythe 

5.119 

2 

11.574 

0.026 


a. Assymptotically F distributed (F assintoticamente dis- 
tribuido) 


e eu recomendo que voce fique com os valores 
calculados na Saida 8.6 do SPSS e acredite que 
eles fazem o que devem fazer (voce tambem 
deve notar que os graus de liberdade do erro fo- 
ram ajustados e precisa lembrar-se disso quan¬ 
do for relatar esses valores!). 

8.4.2 Saidas para as comparagoes 
planejadas © 

Na Segao 8.31, solicitamos que o SPSS rea- 
lizasse duas comparagoes planejadas: uma para 
testar se o grupo-controle era diferente dos dois 
grupos que receberam o Viagra e outro para ver 
se as duas doses de Viagra faziam diferenga na 
libido. A Saida do SPSS 8.7 mostra os resulta¬ 
dos das comparagoes que foram solicitadas para 
os dados do Viagra. A primeira tabela apresenta 
os contrastes dos coeficientes; esses valores sao 
os que foram digitados na Segao 8.3.1 e vale a 
pena olhar essa tabela para verificar novamente 
que os contrastes estao comparando aquilo que 
eles deveriam comparar! Como uma regra prati- 
ca rapida, lembre que quando realizamos com¬ 
paragoes planejadas arranjamos os pesos de tal 
forma que comparamos qualquer grupo com um 
peso positivo contra qualquer grupo com pesos 
negativos. Portanto, a tabela dos pesos mostra 
que o contraste 1 compara o grupo-placebo con¬ 
tra os dois grupos-experimentais e o contraste 2 
compara o grupo de baixa dosagem contra o de 
alta dosagem. E util dar uma olhada nessa tabela 
para se certificar de que os pesos digitados no 
SPSS correspondent aos pesos que nos, de fato, 
pretendiamos informar ao SPSS! 

A segunda tabela fornece a estatistica para 
cada contraste. Note que as estatisticas sao pro- 
duzidas para situagoes nas quais as variancias 
dos grupos sao iguais e para quando elas sao di- 
ferentes. Se o teste de Levene foi significativo, 
voce deve ler a parte da tabela rotulada como: 
Does not assume equal variances (Nao assu¬ 
me a igualdade de variancias). Contudo, para 
esses dados o teste de Levene nao foi significa¬ 
tivo, portanto, podemos utilizar a parte da tabela 
denominada Assume equal variances (Assume 
a igualdade de variancias). A tabela nos informa 
o valor do contraste, que e a soma ponderada da 
media dos grupos. Esse valor e obtido toman- 
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Saida do SPSS 8.7 


Contrast Coefficients (Coeficientes dos contrastes) 


Contrast 

(Contraste)o 

Placebo 

(Placebo) 

Low Dose (Baixa 
Dosgaem) 

High Dose (Alta 
Dosagem) 

1 

2 

-2 

0 

i 

-i 

i 

i 


Contrast Tests (Testes dos contrastes) 



Contrast 

(Contraste) 

Value of 
Contrast (Valor 
do contraste) 

Std Error 
(Erro 
padrao) 

t 

df( gl) 

Sig. (2-tailed) 
(Sig. bilateral) 

Libido Assume equal variances 

i 

3.8000 

1.5362 

2.474 

12 

0.029 

(Assume a igualdade de 
variancias) 

2 

1.8000 

0.8869 

2.029 

12 

0.065 

Does not assume equal va- 

1 

3.8000 

1.4832 

2.562 

8.740 

0.031 

riances (Nao assume a igual¬ 
dade de variancias) 

2 

1.800 

0.9165 

1.964 

7.720 

0.086 


do a media de cada grupo, multiplicando-a pelo 
peso do contraste de interesse e entao somando 
todos os valores. 6 A tabela tambem fornece o 
erro padrao de cada contraste e a estatfstica t. 
A estatfstica t e obtida dividindo o valor do con¬ 
traste pelo erro padrao (t = 3,8/1,5362 = 2,47) 
e isso e comparado com o valor crftico da distri- 
bui£ao t. A significancia do contraste e dada na 
coluna final e esse valor e bilateral. Utilizando o 
primeiro contraste como exemplo, se o tivesse- 
mos utilizado para testar a hipotese geral de que 
os grupos-experimentais iriam diferir do place¬ 
bo, deverfamos utilizar esse valor bilateral. Con- 
tudo, na realidade testamos a hipotese de que os 
grupos-experimentais irao aumentar a libido 
acima dos nfveis observados no grupo-placebo: 
essa hipotese e unilateral. Obtidas as medias 
para esses grupos e considerando as hipoteses, 
podemos dividir os valores das significances 
por 2 a fim de obter as probabilidades unilate- 
rais. Assim, para o contraste 1, podemos dizer 
que tomar Viagra aumenta significativamen- 
te a libido comparado ao grupo-controle (p = 
0,0145). Para o contraste 2 temos novamente 
uma hipotese unilateral (de que uma alta dosa- 


6 Para o primeiro contraste, esse valor e: 

T,(XW) = [(2,2 x -2) + (3.2 x 1) + (5,0 x 1)] = 3,8 


gem de Viagra ira aumentar a libido mais do que 
uma baixa dosagem) e as medias suportam essa 
hipotese. A significancia para o contraste 2 nos 
informa que uma alta dose de Viagra aumenta 
significativamente a libido mais do que uma 
baixa dosagem (/> unilateral = 0,065/2 = 0,0325). 
Note que se nao tivessemos uma hipotese espe- 
cffica sobre qual grupo teria a media mais alta, 
deverfamos concluir que a dose de Viagra nao 
teria um efeito significativo na libido. Por isso, 
e importante que geremos as hipoteses antes de 
coletar qualquer dado porque esse metodo de 
descoberta cientffica e mais poderoso. 

Em resumo, existe um efeito global do 
Viagra na libido. As comparagSes planeja- 
das revelaram que o Viagra aumentou signi¬ 
ficativamente a libido quando comparado ao 
grupo-controle, f(12) = 2,47, p < 0,05, e que 
uma alta dosagem aumentou significativamen¬ 
te a libido quando comparada com uma baixa 
dosagem, t{ 12) = 2,03, p< 0,05. 

8.4.3 Saidas para os testes post hoc © 

Se nao tivessemos hipoteses especfficas 
sobre o efeito que o Viagra exerce na libido, 
poderfamos executar testes post hoc para com¬ 
parer todos os grupos de participantes entre 
eles. De fato, solicitamos ao SPSS que fizesse 
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isso (veja a Segao 8.3.2), e os resultados dessa 
analise sao mostrados na Saida 8.8 do SPSS. 
Essa tabela mostra os resultados do teste de 
Tukey (conhecido como Tukey HSD) 7 , do pro- 
cedimento de Games-Howell e o teste de Dun- 
net, que foram especificados anteriormente. Se 
observarmos primeiro o teste de Tukey (porque 
nao temos razao para duvidar que as variancias 
populacionais sejam diferentes), fica claro a 
partir da tabela que cada grupo de participantes 
e comparado aos outros grupos restantes. Para 


7 A sigla HSD signfica Honestily Significant Difference 

(Diferenga Honestamente Significativa). 


cada par de grupos, a diferenca entre as medias 
dos grupos e apresentada bem como o erro pa- 
drao, o nfvel de significancia e um intervalo de 
95% de confianga para essa diferenga. Primei¬ 
ro, o grupo-placebo e comparado ao grupo de 
baixa dosagem e revela uma diferenga nao-sig- 
nificativa (Sig. e maior do que 5%), mas quan- 
do comparado ao grupo de alta dosagem existe 
uma diferenga significativa (Sig. e menor do 
que 5%). Essa descoberta e interessante porque 
nossa comparagao planejada mostrou que qual- 
quer dose de Viagra produz um aumento signi¬ 
ficative na libido, embora essas comparagoes 
indiquem que uma dosagem baixa nao faga 


Saida do SPSS 8.8 

Multiple Comparisons (Comparacoes multiplas) 


Dependent Variable: Libido (Variavel dependente: libido) 





Mean 

Difference 

fl-J) 

Std. 

Error 


95% Confidence Interval 
(Intervalo de 95% Confianga) 






Upper 

(1) Dose of Viagra 

(J) Dose of Viagra 

(Diferenga 

(Erro 

Sig. 

Lower Bound 

Bound (Limite 

(1 Dose de Viagra) 

((J) Dose de Viagra) 

Media l-J) 

Padrao) 

(Sig.) 

(Limite Inferior) 

Superior) 

HSD de 

Placebo 

Low Dose (Baixa 

-1.0000 

0.88694 

0.516 

-3.3662 

1.3662 

Tukey 


Dosagem) 

High Dose (Alta Do¬ 
sagem) 

-2.8000* 

0.88694 

0.021 

-5.1662 

-0.4338 


Low Dose (Baixa 

Placebo 

1.0000 

0.88694 

0.516 

-1.3662 

3.3662 


Dosagem) 

High Dose (Alta Do¬ 
sagem) 

-1.8000 

0.88694 

0.147 

-4.1662 

0.5662 


High Dose (Alta 

Placebo 

2.8000* 

0.88694 

0.021 

0.4338 

5.1662 


Dosagem) 

Low Dose (Baixa 
Dosagem) 

1.8000 

0.88694 

0.147 

-0.5662 

4.1662 

Games- 

Placebo 

Low Dose (Baixa 

-1.0000 

0.82462 

0.479 

-3.3563 

1.3563 

Howell 


Dosagem) 

High Dose (Alta Do¬ 
sagem) 

-2.8000* 

0.91652 

0.039 

-5.4389 

-0.1611 


Low Dose (Baixa 

Placebo 

1.0000 

0.82462 

0.0479 

-1.3563 

3.3563 


Dosagem) 

High Dose (Alta Do¬ 
sagem) 

-1.8000 

0.91652 

0.185 

-4.4389 

0.8389 


High Dose (Alta 

Placebo 

2.8000* 

0.91652 

0.039 

0.1611 

5.4389 


Dosagem) 

Low Dose (Baixa 
Dosagem) 

1.8000 

0.91652 

0.185 

-0.8389 

4.4389 

Dunnett f 

Low Dose (Baixa 

Placebo 

1.0000 

0.88694 

0.227 

0.8697 


(> control) 8 

Dosagem) 







(> controle) 

High Dose (Alta 
Dosagem) 

Placebo 

2.8000* 

0.88694 

0.008 

0.9303 



* A diferenga media e significativa ao nivel de 5%. 

a O test t de Dunnett trata um grupo como controle e compara todos os outros contra esse grupo-controle. 
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efeito. Por que existe essa contradigao? (Pense 
um pouco nisso antes de prosseguir.) 

Na Segao 8.2.10.2, expliquei que a primeira 
comparacao planejada compara os grupos-ex- 
perimentais com o grupo-placebo. Especifica- 
mente, ela compara a media dos dois grupos-ex- 
perimentais ((3,2 + 5,0)/2 = 4,1) com a media 
do grupo-placebo (2,2). Assim, a diferenga entre 
esses dois valores (4,1 - 2,2 = 1,9) e que foi 
considerada significativa. Nos testes post hoc, 
quando o grupo de baixa dosagem e comparado 
com o grupo-placebo, o contraste esta testando 
se a diferenga entre as medias desses dois gru- 
pos e significativa. A diferenga, nesse caso, e de 
apenas 1, comparada com uma diferenga de 1,9 
para a comparado planejada. Essa explica^o 
ilustra como e possfvel ter resultados aparente- 
mente contraditorios entre as comparagoes pla- 
nejadas e as compara$oes post hoc. Mais impor- 
tante, ela ilustra o cuidado que devemos ter na 
interpreta^ao dos contrastes planejados. 

O grupo de baixa dosagem e entao com¬ 
parado com o grupo-placebo e com o grupo 
de alta dosagem. Note primeiro que o contras¬ 
te envolvendo os grupos-placebo e de baixa 
dosagem e identico aquele recem-descrito. A 
unica informagao nova e a comparado entre 
as duas condigoes experimentais. As medias 
dos grupos diferem por 1,8, o que nao e signi- 
ficativo. Esse resultado tambem contradiz as 
comparagoes planejadas (lembre que o con¬ 
traste 2 comparou esses grupos e encontrou 
uma difercnca significativa). Pense por que 
essa contradicao esta ocorrcndo. Por um lado, 
testes post hoc por sua natureza sao bilaterais 
(voce os utiliza quando nao tiver uma hipotese 
e voce nao preve a dire^ao da hipotese porque 
ela nao existe!) e o contraste 2 foi significati¬ 
ve somente quando considerado uma hipotese 
unilateral. Contudo, mesmo com um nivel bi¬ 
lateral a comparagao planejada foi mais proxi- 
ma na significancia que o teste post hoc e esse 
fato ilustra que os procedimentos post hoc sao 
mais conservadores (isto e, apresentam menos 
poder de detectar verdadeiras diferencasj que 
as comparagoes planejadas. 

O restante da tabela descreve o teste de 
Games-Howell e uma rapida inspecao reve¬ 


la o mesmo padrao de resultados: os unicos 
grupos que diferem significativamente foram 
o de alta dosagem e o placebo. Esses resulta¬ 
dos confirmam nossas conclusoes a partir do 
teste de Tukey porque mesmo se as variancias 
populacionais nao forem iguais (o que parece 
improvavel uma vez que as variancias amos- 
trais sao bastante semelhantes), o perfil dos 
resultados ainda sera verdadeiro. Finalmente, 
o teste de Dunnet e descrito e voce, espero, 
ira lembrar que solicitamos que o computador 
comparasse os dois grupos-experimentais con¬ 
tra o grupo-controle utilizando uma hipotese 
unilateral de que a media do grupo-controle 
seria menor do que as medias dos grupos-ex¬ 
perimentais. Mesmo com uma hipotese unila¬ 
teral, os nfveis de libido com baixa dosagem 
nao sao diferentes do grupo-placebo. Contudo, 
no grupo de alta dosagem a libido e significati¬ 
vamente maior do que no grupo-placebo. 

A tabela na Saida 8.9 do SPSS mostra os 
resultados do teste de Tukey e do REGWQ. 
Esses testes mostram subconjuntos de gru¬ 
pos que tern a mesma media. Portanto, o tes¬ 
te de Tukey cria dois subconjuntos de grupos 
com medias estatisticamente semelhantes. 
O primeiro desses subconjuntos contem o 
grupo-placebo e o de baixa dosagem (indican- 
do que esses dois grupos apresentam medias 
semelhantes) e o segundo desses subconjuntos 
contem os grupos de alta e baixa dosagem. Es¬ 
ses resultados demonstram que o grupo-pla¬ 
cebo tem uma media semelhante ao grupo de 
baixa dosagem, mas nao ao de alta dosagem, e 
que o grupo de baixa dosagem apresenta me¬ 
dia semelhante tanto ao de alta dosagem quan¬ 
to ao grupo-placebo. Em outras palavras, os 
unicos grupos que apresentam medias signifi- 
cantemente diferentes sao os grupos-placebo 
e de alta dosagem. O teste fornece um valor 
da significancia para cada subconjunto e fica 
claro a partir desses valores que os grupos nos 
subconjuntos nao tern medias significativas 
(como o indicado pelos valores Sig. que sao 
maiores do que 0,05). 

Esses calculos utilizam a media harmo¬ 
nica dos tamanhos amostrais. A media har¬ 
monica e uma versao ponderada da media 
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Saida do SPSS 8.9 


Libido 


Dose of Viagra (Dose de Viagra) 

N 

Subset for alpha =. 05 
(Subconjunto para alfa = 0,05) 

? 

2 

Tukey HSD a 

Placebo 

5 

2.2000 


(HSD de Tukey) 

Low Dose (Baixa Dosagem) 

5 

3.2000 

3.2000 


High Dose (Alta Dosagem) 

5 


5.0000 


Sig. 


0.516 

0.147 

Ryan-Einot-Gabriel- 

Placebo 

5 

2.2000 


Welsch Range 

Low Dose (Baixa Dosagem) 

5 

3.2000 

3.2000 


High Dose (Alta Dosagem) 

5 


5.0000 


Sig. 


0.282 

0.065 


Medias para subconjuntos homogeneos sao apresentadas. 
a Utiliza a media harmonica dos tamanhos amostrais = 5. 


( - ; - 

Dica da Samanta Ferrinho 


A 



V. 


• A ANOVA independente de um fator compara varias medias, quando essas me¬ 
dias vem de grupos diferentes de pessoas; por exemplo, se voce tern varias 
condigoes experimentais e utiliza diferentes participantes em cada condigao. 

• Quando voce tiver gerado hipoteses especificas antes do experimento ser 
realizado utilize as comparagoes planejadas, mas se voce nao tiver hipoteses 
especificas, utilize os testes post hoc. 

• Existem varios testes post hoc diferentes: quando voce tiver amostras do 
mesmo tamanho e variancias homogeneas utilize o REGWQ ou o HSD de 
Tukey. Se os tamanhos das amostras nao diferem muito, utilize o procedi- 
mento de Gabriel, mas se os tamanhos amostrais sao bem diferentes, use 
o GT2 de Hochberg. Se existir qualquer duvida sobre a homogeneidade das 
variancias, utilize o procedimento de Games-Howell. 

• Teste a homogeneidade das variancias utilizando o teste de Levene. Encontre 
a tabela com esse rotulo: se o valor na coluna denominada Sig. e menor do 
que 0,05, a hipotese foi violada. Nesse caso, va para a tabela denominada 
Robust Tests of Equality of Means (Testes robustos de igualdade de medias). 

Se a homogeneidade das variancias nao foi violada (isto e, a significance do 
teste de Levene e maior do que 5%), va para a tabela denominada ANOVA. 

• Na tabela denominada ANOVA (ou Testes Robustos para a Igualdade de Me¬ 
dias - veja acima), olhe para a coluna Sig.: se o valor for menor do que 0,05, 
as medias dos grupos sao significativamente diferentes. 

• Para contrastes e testes post hoc, olhe novamente a coluna Sig. para descobrir 
se suas comparagoes sao significativas (elas serao se o valor da significance 
for menor do que 0,05). 

J 


que leva em conta o relacionamento entre va¬ 
riancias e tamanhos amostrais (veja Howell, 
2002, p. 234). Embora voce nao precise saber 
os caminhos intrincados da media harmoni¬ 
ca, e util que o tamanho amostral harmonico 
seja utilizado, porque elimina o vies que po- 


deria ser introduzido pelos tamanhos amos¬ 
trais diferenciados. Assim, a ANOVA de um 
fator fornece resultados confiaveis mesmo 
com delineamentos desbalanceados (embora 
os delineamentos balanceados tambem apre- 
sentem vantagens!). 
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8.5 CALCULANDO 0 TAMANHO DE 
EFEITO © 

Uma coisa que voce ira notar e que o 
SPSS nao fornece rotineiramente um tamanho 
de efeito para a ANOVA independente de um 
fator. Contudo, vimos na equagao (5.4) que: 

^2 = SSm 

SS T 

E claro que sabemos esses valores a partir 
da safda do SPSS. Assim, podemos simples- 
mente calcular r utilizando o efeito entre gru- 
pos (SS M ) e a quantidade total de variancia nos 
dados (SS T ) - embora por alguma razao bizarra 
ele seja geralmente chamado de eta ao quadra- 
do, if. Depois, basta tomar a raiz quadrada des- 
se valor para obtermos o tamanho de efeito r. 

,2 = SSm 

SS T 


43,73 
r = yJo ,42 
= 0,65 


Utilizando o padrao para tamanhos de 
efeito, isso representa um grande efeito (acima 
do limite de 0,50 que caracteriza um grande 
efeito). Portanto, o efeito do Viagra na libido e 
um achado substancial. 

Contudo, essa medida do tamanho de efei¬ 
to e levemente tendenciosa porque e puramente 
baseada nas somas dos quadrados da amostra 
e nenhum ajuste e feito para o fato de que es- 
tamos tentando estimar o tamanho de efeito na 
populagao. Portanto, muitas vezes utilizamos 
uma medida mais complicada denominada 
omega quadrado (or). Essa estimativa ainda 
e baseada nas somas dos quadrados que vimos 
nesse capftulo, mas, como a razao F, ela utiliza 
a variancia explicada pelo modelo e o erro da 
variancia (nos dois casos, a variancia media ou 
erro medio ao quadrado e usado); 

~ )MSr 


O gl M na equagao e o grau de liberdade 
para o efeito, que voce pode obter da safda do 
SPSS (no caso do efeito principal ele e o nu- 
mero de condigoes experimentais menos 1). 
Assim, nesse exemplo temos: 

, 20,13-(2)1,97 

ft)" =- 

43,73 + 1,97 
_ 16,19 
~~ 45,70 
= 0,35 
cn = 0,60 


Como voce pode ver, isso nos levou a 
uma estimativa levemente superior aquela ob- 
tida pela utilizacao do r e, em geral, a> e uma 
medida mais precisa. Embora nas subsegoes 
na ANOVA eu utilizarei o omega como mi- 
nha medida do tamanho de efeito, pense nele 
como se fosse r (porque ele e basicamente 
uma estimativa nao tendenciosa de r de qual- 
quer forma) e aplique os mesmos padroes para 
decidir quao substancial e um efeito. 

Na maioria das vezes nao e interessante 
termos um tamanho de efeito para toda a ANO¬ 
VA porque ela esta testando uma hipotese geral. 
Em vez disso, o que queremos sao tamanhos de 
efeito para os contrastes (porque eles comparam 
apenas duas coisas e, assim, o tamanho de efei¬ 
to e consideravelmente mais facil de interpre¬ 
tar). Comparagoes planejadas sao testadas com 
estatfsticas t e, dessa forma, podemos utilizar a 
mesma equagao da Segao 7.5.5: 



Sabemos o valor de t e da gl da Safda 8.7 
do SPSS e, assim, podemos calcular r da se- 
guinte forma: 


y 

contrastel 


2,474 2 

V 2,474 2 +12 

I 6,12 

V 18,12 


= 0,58 


SSj + ms r 
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Se voce pensar nos nossos padrocs para o 
tamanho de efeito, isso representa um grande 
efeito (ele esta acima de 0,50, o limite para um 
grande efeito). Portanto, alem de ser estatisti- 
camente significativo, esse efeito e grande e, 
assim, ele representa um achado substancial. 
Para o contraste 2, temos: 


Contraste2 


2,029 2 


2,029 z + 12 


4,12 


116,12 
= 0,51 


Esse resultado e tambem um achado subs¬ 
tancial e representa um grande tamanho de 
efeito. 


8.6 RELATANDO RESULTADOS DA 
ANOVA INDEPENDENTE DE UM 
FATOR © 

Quando relatamos uma ANOVA precisa- 
mos fornecer detalhes da razao F e dos graus 
de liberdade a partir dos quais ela foi calculada. 
Para o efeito experimental nesses dados a razao 
F foi derivada pela divisao da media dos qua- 
drados para o efeito pela media dos quadrados 
dos resfduos. Portanto, os graus de liberdade 
utilizados para determinar a razao F sao os 
graus de liberdade para o efeito do modelo ( gl M 
= 2) e os graus de liberdade para os resfduos 
do modelo ( gI R = 12). Desse modo, a maneira 
correta de relatar o principal achado sera: 

•/ Existe um efeito significativo do Viagra 
nos nfveis da libido, F(2, 12) = 5,12, p < 
0,05, co = 0,60. 

Note que o valor da razao F e precedido 
pelos valores dos graus de liberdade para o 
efeito. Ainda, raramente apresentamos o valor 
exato da significancia da razao F\ em vez dis- 
so, apresentamos que o valor da significancia 
p, foi menor do que o valor criterio para o teste 
de 0,05 e inclufmos uma medida do tamanho 
de efeito. O contraste linear pode ser apresen- 
tado praticamente da mesma forma: 


/ Existe uma tendencia linear significativa, 
F( 1, 12) = 9,97, p < 0,01, co = 0,62, indi- 
cando que a medida que a dose de Viagra 
cresce, a libido aumenta proporcional- 
mente. 

Note que os graus de liberdade mudaram 
para refletir como a razao F foi calculada. Eu 
incluf, tambem, uma medida do tamanho de 
efeito (tente calcular isso como foi feito para a 
razao F principal e veja se voce obtem o mes- 
mo valor). Ainda, relatamos que o valor F foi 
significativo a um valor menor do que o valor 
criterio de 0,01. Podemos, tambem, relatar os 
contrastes planejados: 

/ Os contrastes planejados revelaram que 
qualquer dose de Viagra aumentou signi- 
ficativamente a libido quando comparado 
com o placebo, t( 12) = 2,47, p < 0,05 
(unilateral), r = 0,58 e que uma alta dosa- 
gem aumentou significativamente a libido 
quando comparada com uma baixa dosa- 
gem, t( 12) = 2,03, p < 0,05 (unilateral), 
r = 0,51. 

Observe que nos dois casos eu declarei 
que foi utilizada uma probabilidade unilateral. 

8.7 VI0LAQ0ES DAS HIPOTESES DA 
ANOVAINDEPENDENTE DE 
UM FATOR © 

Mencionei varias vezes neste capftulo que 
a ANOVA e resistente a violacoes das suas hi- 
poteses. Podemos tambem ver que ha medidas 
que podem ser tomadas quando existe hetero- 
geneidade das variancias (Quadro 8.3). Con- 
tudo, existe uma alternativa, que e utilizar um 
grupo de testes (frequentemente denominados 
distribuigao livre ou nao-parametricos, mas 
nenhum dos dois nomes e apropriado!). Bern, 
a ANOVA independente de um fator tambem 
apresenta uma contraparte nao-parametrica 
chamada de testes de Kruskal-Wallis. Se voce 
nao tiver dados normalmente distribufdos, ou 
teve outra hipotese violada, esse teste podera 
ser uma alternativa util para resolver o proble- 
ma. Esse teste e descrito no Capftulo 13. 
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8.8 0 QUE DESCOBRIMOS SOBRE 
ESTATISTICA? ® 

Neste capitulo abordamos a analise de va¬ 
riancia (ANOVA), que e o topico dos proximos 
capftulos tambem. A ANOVA independente de 
um fator e utilizada em situagoes onde quere- 
mos comparar varias medias e os dados foram 
coletados utilizando diferentes participantes 
em cada condigao. Comecei explicando que 
se fizermos muitos testes 1 nos mesmos dados, 
a nossa taxa de erro do Tipo I ira inflacionar. 
Portanto, utilizamos a ANOVA em vez dos 
testes t. Relatei como a ANOVA pode ser con- 
ceitualizada como um MLG (Modelo Linear 
Geral), assim ela e, de fato, o mesmo que uma 
regressao multipla. Como em uma regressao 
multipla, existem tres medias importantes que 
utilizamos na ANOVA: a soma total dos qua- 
drados, SS T (uma medida da variabilidade nos 
dados), a soma dos quadrados do modelo, SS M 
(uma medida de quanta variabilidade pode ser 
explicada pela nossa manipulacao experimen¬ 
tal) e SS R (uma medida de quanta variabilida¬ 
de nao pode ser explicada pela manipulagao 
experimental). Descobrimos que a razao F e 
simplesmente a razao entre a variancia que 
podemos explicar pela variancia que nao po- 
demos. Tambem descobrimos que uma razao 
F significativa nos informa apenas que nossos 
grupos diferem, mas nao como eles diferem. 
Para descobrir onde estao as diferengas temos 
duas opgoes: determinar contrastes especificos 
para testar hipoteses (contrastes planejados) ou 
testar cada grupo contra cada um dos demais 
grupos (testes post hoc). A primeira e utilizada 
quando temos hipoteses formuladas antes da 
condigao do experimento e a segunda e para 
explorar os dados quando nenhuma hipotese 
foi feita. Finalmente, descobrimos como pro- 
gramar esses procedimentos no SPSS. 

8.9 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• Analise de Variancia (ANOVA) 

• Corregao de Bonferroni 

• F de Brown-Forsythe 


• Tendencia cubica 

• Graus de liberdade 

• Desvios dos contrastes 

• Contraste de Helmert 

• ANOVA independente 

• Omega ao quadrado 

• Ortogonal 

• Comparagoes pareadas 

• Contrastes planejados 

• Contrastes polinomiais 

• Contraste diferenga (Contraste reverso de 
Helmert) 

• Taxa de erro experimental 

• Taxa de erro de conjunto 

• Variancia geral 

• Media harmonica 

• Tendencia Quadratica 

• Tendencia Quartica 

• Contraste repetido 

• Contraste simples 

• Ponderagoes (pesos) 

• F de Welch 

• Testes post hoc 


8.10 TAREFAS DO ALEX ESPERTO 



Tarefa 1: Imagine que eu esteja 
interessado em como diferentes 
metodos de ensino afetam o co- 
nhecimento dos estudantes. No- 
tei que alguns professores sao 
arrogantes e distantes no seu estilo de en- 
sinar e humilham qualquer um que se 
atrever a formular uma questao, enquanto 
outros estimulam e apoiam perguntas e 
comentarios. Lecionei o mesmo conteudo 
em tres cursos de estatfstica. Para um gru¬ 
po eu andava pela sala com uma grande 
vara e batia em qualquer um que fizesse 
uma pergunta idiota ou respondesse erra- 
do (punitivo). No segundo grupo utilizei 
meu metodo normal de ensino que e in- 
centivar o aluno a discutir assuntos que 
eles achassem dificeis e fornecendo a 
qualquer um que se esforgasse uma re- 
compensa ( incentivador ). No ultimo gru¬ 
po permaneci indiferente e nao recom¬ 
pense! nem tampouco puni o esforgo 
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(indiferente). Usei a nota nos alunos no 
exame (em percentual) como uma medida 
dependente. Com base nas teorias do con- 
dicionamento operante, espera-se que o 
metodo punitivo seja a forma malsucedida 
de reforgo de aprendizagem, mas espera-se 
que o metodo incentivador seja bem-suce- 
dido. Dessa forma, uma previsao e que o 
metodo incentivador ira produzir a me- 
Ihor aprendizagem. Uma segunda hipo- 
tese e que o metodo punitivo ira retardar 
a aprendizagem de modo que ele e pior 
do que a abordagem indiferente. Os da¬ 
dos estao no arquivo Teach.sav. Execute 
uma ANOVA de um fator e utilize as 
comparagoes planejadas para testar as 
hipoteses que (1) o metodo incentivador 
resulta em melhores notas do que o 
metodo punitivo e o indiferente; e (2) o 
metodo indiferente ira produzir resulta- 
dos significativamente melhores do que 
o punitivo. © 

• Tarefa 2. No Capitulo 13 (Segao 13.4) 
existem alguns dados sobre se comer re- 
feigbes com soja reduz a contagem de 
espermatozoides. De uma olhada nessa 
segao, acesse os dados para esse exem- 
plo, mas utilize a ANOVA para analisa- 
los. Qual e a diferenga sobre o que voce 
encontrou e o que esta na Segao 13.4? 
Por que voce acha que essa diferenga sur- 
giu? © 

• Tarefa 3. Estudantes (e professores) ado- 
ram os seus celulares, o que e bastante 
preocupante dado as recentes controver- 
sias sobre a relagao entre o uso de celula¬ 
res e tumores cerebrais. A ideia basica e 
que telefones celulares emitem micro-on- 
das e, assim, manter um proximo a cabega 
por um numero elevado de horas e mais 
ou menos como colocar o cerebro num 
forno de micro-ondas e apertar o botao 
“cozinhar ate que fique bem passado”. Se 
quisessemos testar isso de forma experi¬ 
mental, poderramos arranjar seis grupos 
de pessoas e fixar um telefone movel na 
suas cabegas (de forma que eles nao pos- 
sam remover). Entao, por controle remo- 


to, ligarfamos os telefones por certo tem¬ 
po cada dia. Apos seis meses, medirfamos 
o tamanho de qualquer tumor (em mm 3 ) 
proximo ao local da antena (logo atras da 
orelha). Os seis grupos apresentariam 0, 
1, 2, 3, 4 ou 5 horas diarias de micro-on- 
das do telefone por seis meses. Os dados 
desse exemplo estao no arquivo Tumour, 
sav (De Fiel e Hole, 2003, existe uma so- 
lugao bastante detalhada no arquivo). © 

As respostas estao no arquivo Answers 

(Chapter 8).pdf no site www.artmed.com.br. 

8.11 LEITURAS COMPLEMENTARES 

HOVELL, D. C. Statistical methods for 
psychology. Belmont (CA): Duxbury, 2002. 

5nd ed. Os Capftulos 11 e 12 fornecem 
uma abordagem detalhada da ANOVA e o 
Capitulo 16 cobre os MLG (Modelos Lineares 
Generalizados). 

IVERSEN, G. R„ NORPOTH, H. ANOVA. 

Sage university paper series on quantitative 
applications in the social sciences, 07-001. 
Newbury Park (CA): Sage. 1987. 2nd ed. Texto 
de alto nivel, mas uma boa leitura para aqueles 
que gostam de matematica. 

KLOCKARS, A. J„ SAX, G. Multiple 

comparisons. Sage university paper series on 
quantitative applications in the social sciences, 
07-061. Newbury Park (CA): Sage, 1986. De 
alto nivel, mas com uma cobertura completa 
sobre comparagoes multiplas - para mim esse 
livro e melhor do que o de Toothaker para 
comparagoes planejadas. 

ROSENTHAL, R. ROSNOW. R. L, RUBIN, D. 

B. Contrasts and effect sizes in behavioral 
research: a correlational approach. 

Cambridge: Cambridge University Press, 

2000. Livro fantastico sobre comparagoes 
planejadas por tres dos melhores escritores 
sobre estatistica. 

ROSNOW, R. L, ROSENTHAL, R. Beginning 
behavioral research: a conceptual primer. 
Englewood Cliffs (NJ): Hall, 2005. 5 a ed. E 
eles escreveram outro otimo livro! 

TOOTHAKER, L. E. Multiple comparison 
procedures. Sage university paper series on 
quantitative applications in the social sciences, 
07-089. Newbury Park (CA): Sage, 1993. 
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Tambem de alto nfvel, mas fornece uma 
excelente abordagem sobre os procedimentos 
post hoc. 

WRIGHT, D. B. First steps in statistics. London: 
Sage, 2002. Se esse capftulo for muito 


complicado, o Capftulo 7 do Wright fornece 
uma introdu§ao basica a ANOVA de facil 
leitura. 



9 

ANALISE DE COVARIANCIA, 
ANCOVA (MLG 2) 


APRENOER NESTE 

No capftulo ante¬ 
rior, vimos como a 
ANOVA de um fator 
pode ser caracterizada 
em termos de uma 
equacao de regressao 
multipla que utiliza 
variaveis dummy (auxiliares) para codificar a 
pertinencia aos grupos. Alem disso, no Capftu¬ 
lo 5 vimos como a regressao multipla pode in- 
corporar diversas variaveis previsoras contfnuas. 
Dessa forma, nao deve ser surpresa verificar que 
a equagao de regressao para ANOVA pode ser 
estendida para incluir uma ou mais variaveis 
contfnuas que podem prever a safda (ou variavel 
dependente). Variaveis contfnuas como essas - 
que nao sao parte da manipulagao experimental 
principal, mas que tem influencia na variavel 
dependente - sao conhecidas como covariaveis 
e podem ser inclufdas em uma ANOVA. Quan- 
do mensuramos as covariaveis e as inclufmos na 
ANOVA, denominamos o procedimento de 
analise de covariancia (ou ANCOVA). Este 
capftulo esta centrado nessa tecnica. Comeg are- 
mos apresentando a teoria da ANCOVA de uma 
forma breve (nao se preocupe, nao entrarei em 


rnuitos detalhes) e uma hipotese adicional, a ho- 
mogeneidade dos coeficientes de regressao. 
Tambem iremos mostrar um exemplo com a 
ajuda do SPSS e ver como interpretar e relatar 
os resultados dessa tecnica. 

9.2 0 QUE E ANCOVA? © 

No ultimo capftulo, usamos um exemplo 
que verificava os efeitos do Viagra na libido. 
Vamos pensar em outras coisas alem do Via¬ 
gra que podem influenciar a libido: bem, a 
mais obvia e a libido do parceiro sexual do 
participante (sao necessarios dois para dancar 
um tango!), mas existem outras coisas, como 
medicamentos que podem inibir a libido (an- 
tidepressivos ou a pflula anticoncepcional) 
e a fadiga. Se essas variaveis (chamadas de 
covariaveis) sao medidas, e possfvel contro- 
lar a influencia que elas exercem na variavel 
dependente pela sua inclusao no modelo de 
regressao. Do que aprendemos sobre regres¬ 
sao hierarquica (veja o Capftulo 5), deve ter 
ficado claro que se entrarmos com a covaria- 
vel no modelo de regressao primeiro e depois 
entrarmos com as variaveis dummies (auxilia¬ 
res) representando a manipulacao experimen¬ 
tal, sera possfvel ver qual o efeito que uma 


9.1 0 QUE VOCE VAI 
CAPITULO? © 
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variavel independente tem apos o efeito da co¬ 
variavel. Assim, nos controlamos o efeito da 
covariavel. Existem dois motivos para incluir 
covariaveis na ANOVA. 

• Para reduzir a variancia do erro dentro 
do grupo: Na discussao sobre a ANOVA 
e o teste t nos acostumamos com a ideia de 
que avaliamos o efeito de um experimento 
comparando o montante de variabilidade 
nos dados que o experimento pode expli- 
car contra a variabilidade que ele nao con- 
segue explicar. Se conseguirmos explicar 
parte dessa variancia “inexplicada” ( SS R ) 
em termos de outras variaveis (covaria¬ 
veis), reduziremos a variancia do erro e 
determinaremos com maior precisao o 
efeito da variavel independente ( SS M ). 

• Kliminacao dos confundidores: Em qual- 
quer experimento pode haver variaveis 
nao medidas que confundem os resultados 
(isto e, variaveis que podem variar siste- 
maticamente com a manipulacao experi¬ 
mental). Se for sabido que uma variavel 
pode influir na variavel dependente sendo 
medida, a ANCOVA e ideal para remover 
a parcialidade dessa influencia. Uma vez 
que uma possivel variavel de confusao foi 
identificada, ela pode ser medida e entrar 
na analise como uma covariavel. 

Existem outras razoes para incluir cova¬ 
riaveis na ANOVA, mas como nao pretendo 
descrever os calculos da ANCOVA, recomen- 
do que o leitor interessado consulte Wildt e 
Ahtola (1978) ou Stevens (1992, Capitulo 9). 

Imagine que o pesquisador que conduziu 
o estudo sobre o Viagra no capitulo anterior 
subitamente se deu conta de que a libido do 
parceiro do participante poderia afetar a libido 
do proprio participante (especialmente porque 
a medida da libido foi comportamental). Ele 
repetiu o estudo num conjunto diferente de 
participantes, mas dessa vez medindo a libido 
do parceiro. A libido do parceiro foi medida 
levando-se em conta a frequencia com que 
eles tentaram iniciar um contato sexual. No 
capitulo anterior, vimos que esse cenario ex¬ 
perimental pode ser caracterizado em termos 


de equagao (8.2). Pense no que aprendemos 
sobre a regressao multipla (Capitulo 5) e voce 
vera que essa equagao pode ser estendida para 
incluir essa covariavel (veja a equagao 9.1): 

Libido; = b 0 + ^Covariavel, + Zz 2 Alto, 

+ fojBaixOj + e, 

Libido, = b 0 + hjLibido do Parceiro, 

+ Z? 2 Alto, + bj Baixo, + e, (9.1) 


9.3 EXECUTANDO A ANCOVA NO 
SPSS© 

Os dados para esse exemplo estao na Ta- 
bela 9.1 e podem ser encontrados no arquivo 
ViagraCovariate.sav. A Tabela 9.1 mostra 
a libido dos participantes, dos parceiros e as 
medias (os desvios padrao estao entre paren- 
teses) dos varios escores. Recomendo incluir 
esses dados no editor manualmente. Faga isso 
da mesma forma que foi feito para os dados 
do Viagra do capitulo anterior, exceto que uma 
variavel a mais deve ser criada para incluir os 
valores da covariavel. 

9.3.1 Atribuindo dados CD 

Os dados devem ser exibidos no editor 
de dados assim como eles estao na Tabela 9.1 
(excluindo as linhas das medias e dos desvios 
padrao). Para tanto, crie uma variavel codigo 
chamada de dose e use a opgao Labels (Ro- 
tulos) para definir o valor dos rotulos (como 
no Capitulo 8, recomendo 1 = placebo, 2 = 
dose baixa, 3 = dose alta). Existem diferentes 
numeros de participantes em cada condigao, 
assim, voce precisa incluir nove valores de 1 
nessa coluna (de modo que as primeiras nove 
linhas contenham o valor 1), seguido por oito 
linhas contendo o valor 2 e mais 14 linhas 
contendo o valor 3. Nesse ponto, voce deve ter 
uma coluna com 30 linhas de dados. A seguir, 
crie uma segunda variavel chamada libido e 
entre com os 30 escores que correspondem a 
libido de cada pessoa. Finalmente, crie uma 
terceira variavel chamada de partner (parcei¬ 
ro) e use a opgao Labels (Rotulos) para dar 
a essa variavel o titulo de “Partners libido” 
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Tabela9.1 Dados do arquivo 
ViagraCovariate.sav 


Dose 

Libido do 
Participants 

Libido do(a) 
parceiro(a) 


3 

5 


2 

2 


5 

6 


2 

2 

Placebo 

2 

3 


2 

3 


7 

7 


2 

4 


4 

5 

X 

3,22 

4,11 

s 

(1,79) 

(1,76) 


7 

10 


5 

8 


3 

6 

Dosagem 

4 

7 

baixa 

4 

7 


7 

11 


5 

9 


4 

7 

X 

4,88 

8,13 

S 

(1,46) 

(1,73) 


9 

2 


2 

3 


6 

5 


3 

4 


4 

3 


4 

3 

Dosagem Alta 

4 

2 


6 

0 


4 

1 


6 

3 


2 

0 


8 

1 


5 

0 

X 

4,85 

2,08 

S 

(2,12) 

(1,61) 


(Libido do parceiro). Depois, entre com os 30 
escores que correspondem a libido dos parcei- 
ros. Lembre que as medias (e desvios padrao) 
que eu incluf na tabela nao sao solicitadas 
pelo SPSS! 

9.3.2 Analise principal © 

A maioria dos procedimentos da ANOVA 
fatorial no SPSS content a possibilidade de 
incluir uma ou mais covariaveis. Entretanto, 
para delineamentos mais simples (a maio¬ 
ria dos que nao incluem medidas repetidas) 
e melhor realizar a ANCOVA pelo procedi- 
mento fatorial geral (general factorial). Para 
acessar a caixa de dialogo principal, siga o se- 
guinte caminho: Analyze=>General Linear 
Model=>Univariate... (Analisar^Modelo 
Linear Geral=>Univariado) (veja a Figura 
9.1). 1 A caixa de dialogo principal e seme- 
lhante aquela da ANOVA de um fator, exceto 
que existe um espago para especificar as cova¬ 
riaveis. Selecione libido e coloque-a no espa¬ 
go denominado Dependent Variable (Variavel 
Dependente) clicando em AJ. Selecione dose 
e transfira-a para o espago denominado Fixed 
Factor(s) (Fator Fixo), depois selecione part¬ 
ner (parceiro) e coloque-a no espago denomi¬ 
nado Covariate(s) (Covariavel). 

9.3.3 Contrastes e outras opgoes © 

Existem varias caixas de dialogo que po- 
dem ser acessadas a partir da principal. Ob¬ 
serve que se uma covariavel for selecionada, 
os testes post hoc sao desabilitados (voce nao 
pode acessar essa caixa de dialogo). Os testes 
post hoc nao sao projetados para situagoes nas 
quais uma covariavel e especificada; entre¬ 
tanto, algumas comparagoes podem ser feitas 
usando contrastes. 

Clique em (contrastes) para acessar 
a caixa de dialogo contrasts (contrastes). Essa 
caixa de dialogo e diferente daquela que aces- 
samos no Capitulo 8: naquela nao e possfvel 


1 Statistics=>General Linear Model=>GLM-General 

Factorial... (Estatistica=>ModeloLinearGeral=>MLG- 
Fatorial Geral) na versao 8.0 ou anteriores. 
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Figura 9.1 Caixa de dialogo principal para o MLG univariado. 


entrar com codigos para especificar contrastes 
especfficos. Em vez disso, e possfvel selecio- 
nar uma das varias possibilidades de contrastes 
padrao. Esses contrastes padrao foram lista- 
dos na Tabela 8.6. Nesse exemplo havia uma 
condigao de controle (o placebo codificado 
como o primeiro grupo), assim, um conjunto 
de contrastes sensfveis seria contrastes do tipo 
simples (simple) comparando cada grupo-ex- 
perimental com o controle. O contraste padrao 
do SPSS e um contraste de desvio (deviation) 
e, para mudar isso, precisamos primeiro clicar 
em ao lado do quadro rotulado de Contrast 
(Contraste). Uma lista de contrastes ira apare- 
cer automaticamente e voce deve selecionar 
o tipo de contraste (nesse caso. Simple (Sim¬ 
ples)) desta lista que ira desaparecer tambem 
automaticamente. Para contrastes simples voce 
tem a opgao de especificar a categoria de refe¬ 
renda (que e a categoria contra a qual todos 
os outros grupos sao comparados). Por padrao 
a categoria de referenda e a ultima categoria: 
como nesse caso o grupo-controle foi a primei- 
ra categoria (assumindo que voce codificou o 
placebo como 1), nos precisamos mudar essa 
opgao selecionando K n i u (Primeiro). Quando 
voce selecionar um contraste novo, deve clicar 
em c"-'* (Alterar) para registrar essa mudanga. 


A caixa de dialogo final deve ser semelhante a 
da Figura 9.2. Clique em 1°“*" (continuar) para 
retornar a caixa de dialogo principal. 

Outra maneira de realizar os testes post 
hoc e clicando em 0p ‘° nt (opgoes) para aces- 
sar opgoes da caixa de dialogo (veja a Figura 
9.3). Para especificar os testes post hoc, selecio- 
ne a variavel independente (nesse caso, dose) 
do quadro denominado Estimated Marginal 
Means: Factor(s) (Medias marginais esti- 
madas: Fator(es)) e Factor Interactions (In- 



Figura 9.2 Opgoes para os contrastes padrao 
no MLG univariado. 
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Figura 9.3 Caixa de dialogo Options (Opgoes) para o MLG univariado. 


teragoes de fator) e transfira-a para o quadro 
denominado Display Means (Mostrar as Me- 
dias) clicando em _!_l. Uma vez que a variavel 
foi transferida, a caixa rotulada de Compare 
main effects (Comparar efeitos principals) 
torna-se ativa e voce deve selecionar essa opgao 
( ||7 comport main »ne«s ). Se essa opgao e selecionada, 
o quadro denominado Confidence interval 
adjustment (Ajuste do intervalo de confian- 
ga) torna-se ativo e voce pode clicar em Ll para 
escolher uma opgao entre tres possfveis niveis 
de ajuste. O padrao e nao ter ajustamentos. A 
primeira opgao e realizar o procedimento post 
hoc Tukey LSD (que nao recomendo); a segun- 
da e solicitar uma corregao de Bonferroni (essa 
eu recomendo) e a opgao final e uma corregao 
de Sidak. A corregao de Sidak e parecida com 
a corregao de Bonferroni, mas menos conser- 
vadora; desse modo, deve ser selecionada se 
voce esta preocupado com a perda de poder 
associada aos valores corrigidos de Bonferroni. 
Para esse exemplo utilize a corregao de Sidak 
(iremos usar a de Bonferroni mais adiante neste 
capitulo). Assim como a realizagao dos testes 
post hoc para a variavel dose (dose), colocar a 
variavel dose (dose) no quadro Display Means 


for (Mostrar as Medias para) ira resultar numa 
tabela de medias marginais estimadas para essa 
variavel. Essas medias fornecem uma estimati- 
va das medias do grupo ajustadas (isto e, as me¬ 
dias apos a contribuigao da covariavel). Quando 
voce tiver selecionado as opgdes solicitadas 
(veja o Quadro 9.1), clique em (conti- 
nuar) para retornar a caixa de dialogo principal. 
Existem outras opgoes disponiveis na caixa de 
dialogo principal. Por exemplo, se voce tem di- 
versas variaveis independentes, pode represen- 
ta-las graficamente umas contra as outras (o que 
e util para interpretar efeitos de interagao - veja 
a Segao 10.3.3). Para essa analise existe somen- 
te uma variavel independente, assim, podemos 
clicar em I°!L a fim de executar a analise. 

9.4 INTERPRETANDO AS SAIDAS DA 
ANCOVA © 

9.4.1 Analise principal © 

A Saida 9.1 do SPSS mostra (como ilus- 
tragao) a tabela da ANOVA para esses dados 
quando a covariavel nao esta incluida. Fica 
claro a partir do valor da significancia, maior 
do que 0,05, que nao ha diferengas na libido 
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Quadro 9.1 


Opgoes para a ANCOVA © 

As opgoes restantes nessa caixa de dialogo sao as seguintes: 

• Descriptives Statistics (Estatisticas descritivas): Essa opgao produz uma tabela com as 
medias e os desvios padrao de cada grupo. 

• Estimates of effect size (Estimativas do tamanho de efeito): Essa opgao produz o valor 
do eta quadrado(z) 2 ), descrito na Segao 8.5, que e uma medida do tamanho de efeito expe¬ 
rimental. Na verdade, o eta quadrado e o coeficiente de regressao (R 2 ) para uma linha de 
regressao nao-linear (isto e, uma curva) passando supostamente pelas medias de todos 
grupos. Na populagao essa suposigao e verdadeira, mas nas amostras nao; portanto, o 
eta quadrado e geralmente viciado (veja a Segao 8.5 e Howell, 2002, Segao 11.11). Por 
esse motivo, essa opgao e pouco recomendada e o tamanho de efeito pode ser melhor 
estimado utilizando-se o omega ao quadrado (a> 2 ) - veja a Segao 9.7. 

• Observed power (O poder observado): Essa opgao fornece uma estimativa da probabilida- 
de de que o teste estatlstico detecte a diferenga entre as medias dos grupos (veja a Segao 
1.8.5). Essa medida nao e muito utilizada porque se o teste F e significativo, a probabilidade 
de que o efeito tenha sido detectado sera, e claro, alta. Da mesma forma, se as diferengas 
entre os grupos forem pequenas, o poder observado sera baixo. 0 poder observado e de 
pouca utilidade e devo aconselhar que os calculos do poder (exceto o do tamanho amos- 
tral) sejam feitos antes que o experimento seja conduzido (veja Cohen, 1988, 1992; Howell, 
2002, para ver como fazer isso manualmente; Field, 1998b, para ver como fazer os calcu¬ 
los usando o computador; ou utilize o software gratis G* Power disponivel no site www. 
artmed.com.br ou em http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/). 

• Parameter estimates (Estimativas Parametricas): Essa opgao produz uma tabela dos coe- 
ficientes de regressao e suas significances para as variaveis do modelo de regressao (veja 
a Segao 9.5). 

• Contrast coefficient matrix (Matriz de coeficiente de contraste): Essa opgao produz ma- 
trizes dos valores dos codigos utilizados por qualquer contraste na analise. E util apenas 
para checar quais grupos estao sendo comparados em quais contrastes. 

• Homogeneity tests (Testes de homogeneidade): Essa opgao produz o teste de Levene de 
homogeneidade das variancias (veja as Segoes 3.6 e 8.4.1). 

• Spread vs. Level plot (Espalhamento vs. diagrama de nivel): Essa opgao produz um dia- 
grama que mostra a media de cada grupo de um fator (eixo-X) contra o desvio padrao da- 
quele grupo (eixo-Y). E um recurso util para verificar que nao existe relacionamento entre 
a media e o desvio padrao. Se existe um relacionamento, talvez seja necessario estabilizar 
os dados utilizando uma transformagao logaritmica (veja o Capitulo 3). 

• Residual plots (Diagrama dos residuos): Essa opgao produz diagramas de valores resi- 
duais padronizados observados vs. previstos. Esses diagramas podem ser usados para 
avaliar a hipotese da igualdade de variancia. 


entre os tres grupos; portanto, o Viagra parece 
nao ter efeito significativo na libido. Voce deve 
ter notado, tambem, que o total da variagao a 
ser explicada ( SS T ) foi 110,97 (Total Corrigi- 
do ), sendo que a manipulagao experimental foi 
responsavel por apenas 16,84 unidades (SS M ), 
enquanto 94,12 nao foram explicadas (SS R ). 


A Saida 9.2 do SPSS mostra os resulta- 
dos do teste de Levene e a tabela da ANO- 
VA quando a libido dos parceiros e inclufda 
no modelo como uma covariavel. O teste de 
Levene e significativo, indicando que as va¬ 
riancias dos grupos nao sao iguais (portanto, 
a hipotese da homogeneidade da variancia 
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Saida 9.1 do SPSS 

Tests of Between-Subjects Effects (Testes de efeitos entre participantes) 


Dependent Variable: Libido (Variavel Dependente: Libido) 


Source (Fonte) 

Type III Sum of Squares (Soma 
dos quadrados do tipo III) 

df 

(gi) 

Mean Square 
(Media ao quadrado) 

F 

Sig. 

Corrected Model (Modelo 

16.844 a 

2 

8.422 

2.416 

0.108 

Corrigido) 






Intercept (Intercepto) 

535.184 

1 

535.184 

153.533 

0.000 

DOSE (Dose) 

16.844 

2 

8.422 

2.416 

0.108 

Error (Erro) 

94.123 

27 

3.486 



Total (Total) 

683.000 

30 




Corrected Total (Total cor- 

110.967 

29 




rigido) 







a. R Squared = .152 (Adjusted R Squared = .089 (R ao quadrado = 0,152 (R ao quadrado ajustado = 0,089)) 


foi violada). Entretanto, como foi menciona- 
do na Segao 3.6, o teste de Levene nao e ne- 
cessariamente a melhor maneira de julgar se 
as variancias sao desiguais o suficiente para 
causar problemas. Uma boa maneira de se 
assegurar disso e verificar novamente os va- 
lores da maior e da menor variancia. Para os 
nossos tres grupos temos os desvios padrao 
de 1,79 (grupo-placebo), 1,46 (grupo de bai- 
xa dosagem) e 2,12 (grupo de alta dosagem) 
- veja a Tabela 9.1. Se elevarmos ao quadra¬ 
do esses valores, teremos variancias de: 3,20 
(grupo-placebo), 2,13 (grupo de baixa dosa¬ 
gem) e 4,49 (grupo de alta dosagem). Pode- 
mos, entao, dividir a maior variancia pela me¬ 
nor: nesse caso, 4,49/2,13 = 2,11. Se o valor 
resultante for menor do que 2, provavelmente 
nao precisaremos nos preocupar muito; se for 
maior do que 2 (como e o caso aqui), prova¬ 
velmente teremos problemas! Entretanto, nao 
vamos nos preocupar muito com as diferencas 
entre as variancias por enquanto. 

O formato dessa 
tabela da ANOVA e, 
em grande parte, o 
mesmo que a da tabe¬ 
la sem a covariavel, 
exceto que agora te¬ 
mos uma linha adicio- 
nal com informagoes 
sobre a covariavel 
(partner (parceiro)). Observando os valores das 
significancias, fica claro que a covariavel preve 
significativamente a variavel dependente porque 


esse valor e menor do que 0,05. Portanto, a libi¬ 
do de um participante e influenciada pela libido 
do parceiro. O mais interessante e que quando o 
efeito da libido do parceiro e removido, o efeito 
do Viagra se torna significante (p e 0,016, o que 
e menor do que 0,05). A quantidade de variagao 
de responsabilidade do modelo ( SS M ) aumentou 
para 34,75 unidades (correted model (modelo 
corrigido)), da qual o Viagra e responsavel por 
28,34 unidades. Ainda mais importante, a gran¬ 
de variagao na libido que e de responsabilidade 
da covariavel significa que a variancia nao-ex- 
plicada (SS R ) foi reduzida para 76,22 unidades. 
Note que o SS T nao mudou; o que mudou foi 
como a variagao total e explicada. 

Esse exemplo ilustra como a ANCOVA 
pode auxiliar a exercer um controle experimen¬ 
tal mais rfgido, levando em consideragao as va- 
riaveis de confusao, para nos dar uma medida 
“mais pura” do efeito da manipulagao experi¬ 
mental. Sem levar em consideragao a libido dos 
parceiros participantes, podemos concluir que 
o Viagra nao teve efeito na libido, mas, na ver- 
dade, ele teve. Entretanto, o efeito da libido do 
parceiro parece mais forte do que o do Viagra. 
Retomando as medias do grupo da Tabela 9.1 
para os dados da libido, fica claro que a signi¬ 
ficance da ANOVA reflete a diferenga entre o 
grupo-placebo e os dois grupos-experimentais 
(porque os grupos de doses alta e baixa tern 
medias semelhantes - 4,88 e 4,85 - enquanto 
a media do grupo-placebo e bem mais baixa, 
3,22). Contudo, sera necessario realizar alguns 
contrastes para verificar isso. 
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Saida 9.2 do SPSS 


Levene's Test of Equality of Error Variances a 
(Teste de Levene para a igualdade das variancias do erro) 

Dependent Variable: Libido (Variavel dependente: libido) 


F 

dfl (gll) 

df2 (gl2) 

Sig. 

5.525 

2 

27 

0.010 


Testa a hipotese nula de que a variancia do erro e a mesma em todos os grupos. 
a. Delineannento: intercepto + Parceiro + Dose. 


Tests of Between-Subjects Effects (Testes de efeitos entre participantes) 


Dependent Variable: Libido (Variavel dependente: libido) 


Source (Fonte) 

Tipe III Sum of 
Squares (Soma dos 
quadrados do tipo III) 

df 

(gl) 

Mean Square 
(Media ao quadrado) 

F 

Sig. 

Corrected Model (Modelo Corrigido) 

34.750 3 

3 

11.583 

3.952 

0.019 

Intercept (Intercepto) 

12.171 

1 

12.171 

4.152 

0.052 

PARTNER (Parceiro) 

17.906 

1 

17.906 

6.109 

0.020 

DOSE (Dose) 

28.337 

2 

14.169 

4.833 

0.016 

Error (Erro) 

76.216 

26 

2.931 



Total (Total) 

683.000 

30 




Correlated Total (Total correlacionado) 

110.967 

29 





a. R quadrado = 0,313 (R quadrado ajustado = 0,234) 


A Saida do SPSS 9.3 mostra as estimativas 
dos parametros selecionadas na caixa de dialogo 
options (op 9 oes). Essas estimativas sao calcula- 
das usando a analise de regressao com a variavel 
dose dividida entre duas variaveis dummy (auxi- 
liares) codificadoras (veja a Segao 8.2.2 e a Segao 
9.5). O SPSS codiftca as duas variaveis auxiliares 
de forma que a ultima categoria (a categoria co- 
diftcada com o valor mais alto no editor de dados 
- nesse exemplo, o grupo de alta dosagem) seja 
a de referenda. Essa categoria de referenda (ro- 
tulada de DOSE = 3 na sat'da) e codiftcada com 
0 para as duas variaveis auxiliares (veja a Seijao 
8.2.2 para lembrar como a codificaijao com varia¬ 
veis auxiliares funciona). DOSE = 2, portanto, 
representa a diferen 9 a entre o grupo codiftcado 
como 2 (baixa dosagem) e a categoria de refe¬ 
renda (alta dosagem), e DOSE = 1 representa a 
diferen^a entre o grupo codiftcado como 1 (pla¬ 
cebo) e a categoria de referenda (alta dosagem). 
Os valores de b literalmente representam as dife- 
ren^as entre as medias desses grupos e, assim, a 
signiftcancia dos testes t nos diz se as medias dos 
grupos diferem significativamente. Os graus de 


liberdade para esses testes t podem ser calculados 
como na regressao normal (veja a Segao 5.2.4) 
utilizando N - p - 1, no qual N e o do tamanho da 
amostra total (nesse caso 30) e p e o numero dos 
previsores (nesse caso, 3, as duas variaveis auxi¬ 
liares e a covariavel - veja a Equa^ao (9.1)). Para 
esses dados, temos gl = 30 - 3 - 1 = 26. 

Portanto, podemos concluir dessas estima¬ 
tivas que o grupo de alta dosagem difere signi¬ 
ficativamente do grupo-placebo (DOSE = 1 na 
tabela), mas que o grupo de alta dosagem difere 
significativamente, tambem, do grupo de baixa 
dosagem (DOSE = 2 na tabela). Essa ultima 
conclusao e peculiar porque contradiz o que ini- 
cialmente conclufmos da ANOVA (lembre que 
as medias das dosagens altas e baixas eram pra- 
ticamente identicas) - voce consegue imaginar 
por que? (Isso sera revelado no devido momen- 
to!). Por ultimo, note o valor de b para a covaria¬ 
vel (0,483). Esse valor nos diz que, mantendo 
tudo igual, se a libido do parceiro aumenta em 
uma unidade, a libido do participante aumentara 
apenas meia unidade (embora nada sugira uma 
ligacao casual entre as duas). O sinal desse coe- 
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Saida 9.3 do SPSS 


Parameter Estimates (Estimativas dos Parametros) 


Dependent Variable: Libido (Variavel dependente: libido) 


Parameter (Parametro) 

B 

Std. Error 
(Erro Padrao) 

t 

Sig. 

95% Confidence Interval 
(Intervalo de 95% de confianga) 

Lower Bound 
(Limite inferior) 

Upper Bound 
(Limite superior) 

Intercept (Intercepto) 

3.843 

0.625 

6.150 

0.000 

2.558 

5.127 

PARTNER (Parceiro) 

0.483 

0.196 

2.472 

0.020 

0.081 

0.085 

(DOSE = 1) 

-2.607 

0.842 

-3.095 

0.005 

-4.338 

-0.876 

(DOSE = 2) 

-2.894 

1.411 

-2.051 

0.050 

-5.794 

0.006 

(DOSE = 3) 

0 a 







a. Esse parametro e fixado em zero porque ele e redundante. 


ficiente nos mostra a dire can do relacionamen- 
to entre a covariavel e a variavel safda. Assim, 
nesse exemplo, o coeficiente positivo significa 
que a libido do parceiro tem um relacionamento 
positivo com a libido do participante: quando 
um aumenta, o outro tambem cresce. Um coefi¬ 
ciente negativo significaria o contrario: a medi- 
da que um aumenta, o outro diminui. 


9.4.2 Contrastes © 

A Saida do SPSS 9.4 mostra o resultado da 
analise dos contrastes especificados na Figura 

9.2 e compara o mvel 2 (baixa dosagem) com 
o nivel 1 (placebo) como uma primeira compa- 
ragao, e o nivel 3 (alta dosagem) com o nivel 
1 (placebo) como uma segunda comparagao. 


Saida 9.4 do SPSS 

Contrast Results (K Matrix) (Resultados dos contrastes (Matriz K)) 





Dependent Variable 

Dose of Viagra (Dose do Viagra) 


(Variavel Dependente) 

Simple Contrast (Contraste Simples) 


Libido 

Level 2 vs. Level 

Contrast Estimate (Estimativa do Contraste) 


-0.287 

7 (Nivel 2 vs. 

Hypothesized Value (Valor Hipotetico) 


0 

Nivel 1) 

Difference (Estimate - Hypothesized) (Diferenga 
- Hipotetica - Estimada) 


-0.287 


Std Erro (Erro Padrao) 


1.144 


Sig. (Sig.) 


0.804 


95% Confidence Interval for Difference (Interva- 

Lower Bound 

-2.638 


lo de Confianga de 95% para a diferenga) 

(Limite Inferior) 
Upper Bound 
(Limite Superior) 

2.064 

Level 3 vs. Level 

Contrast Estimate (Estimativa do Contraste) 


2.607 

7 (Nivel 3 vs. 

Hypothesized Value (Valor Hipotetico) 


0 

Nivel 1) 

Difference (Estimate - Hypothesized (Diferenga 
- Hipotetica - Estimada) 


2.607 


Std Erro (Erro Padrao) 


0.842 


Sig. (Sig.) 


0.005 


95% Confidence Interval for Difference (Interva- 

Lower Bound 

0.876 


lo de Confianga de 95% para a diferenga) 

(Limite Inferior) 
Upper Bound 
(Limite Superior) 

4.338 


a Categoria de referenda = 1. 
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Esses contrastes sao consistentes com o que foi 
especificado: todos os grupos sao comparados 
com o primeiro grupo. As diferengas dos grupos 
sao apresentadas: o valor da diferenca, o erro 
padrao, o valor da significancia e o intervalo de 
95% de confian^a. Esses resultados mostram 
que o grupo de baixa dosagem nao teve uma 
libido significativamente diferente do que a do 
grupo-placebo (contraste 1, p = 0,804), mas 
que o grupo da alta dosagem diferiu significa¬ 
tivamente do grupo-placebo (p = 0,005). Esses 
resultados sao consistentes com as estimativas 
de regressao parametrica (na verdade, note que 
o contraste 2 e identico aos parametros da re¬ 
gressao para DOSE = 1 da se^ao anterior). 

Novamente, tudo isso parece muito estra- 
nho: o efeito significativo da libido parece re- 
fletir uma diferenca entre o grupo-placebo e os 
dois grupos do Viagra (que apresentam medias 
com valores semelhantes), mas os contrastes 
ate agora contradizem essas conclusoes. A ra- 
zao para essa inconsistency e que a conclusao 
inicial foi baseada nas medias dos grupos que 
nao tinham sido ajustadas para o efeito da co¬ 
variavel. Esses valores nada informam sobre as 
difcrencas dos grupos refletidas na significan¬ 
cia da ANCOVA. A Saida 9.5 do SPSS forne- 
ce os valores ajustados das medias dos grupos 
e sao esses os valores que devem ser usados 
para a interpretacao (essa e a razao principal 
para selecionar a opcao Display Means for 
(Mostre as Medias para)). As medias ajustadas 
mostram um padrao bem diferente de respos- 
tas: parece que a significancia da ANCOVA re- 
flete a diferenca entre o grupo de alta dosagem 
e os grupos de baixa dosagem e placebo. Os 
grupos de baixa dosagem e placebo parecem 
ter medias ajustadas bem similares, indican- 
do que uma dosagem baixa de Viagra nao au- 
menta a libido acima de nfveis normais, sendo 
necessario para tanto uma alta dosagem! Es¬ 
sas conclusoes sustentam o que sabemos dos 
contrastes e dos parametros da regressao, mas 
podem ser verificadas com os testes post hoc 
especificados no menu options (opcoes). 

A Saida 9.6 do SPSS mostra os resulta¬ 
dos das comparacoes post hoc corrigidas pelo 
metodo de Sidak que foram solicitadas como 


Saida 9.5 do SPSS 

Estimates (Estimativas) 


Dependent Variable: Libido (Variavel dependente: 
libido) 





95% Confidence 
Interval (Intervalo de 
95% de confianga) 

Dose of 
Viagra 
(Dose de 
Viagra) 

Mean 

(Media) 

Std. 

Error 

(Erro 

Padrao) 

Lower 
Bound 
(Li mite 
Inferior) 

Upper 
Bound 
(Li mite 
Superior) 

Placebo 

(Placebo) 

3.313 a 

0.572 

2.138 

4.489 

Low Dose 
(Baixa Do¬ 
sagem) 

3.027 a 

0.962 

1.049 

5.004 

High Dose 
(Alta Dosa¬ 
gem) 

5.920 a 

0.644 

4.597 

7.244 


a. As covariaveis que aparecem no modelo sao avaliadas 
nos seguintes valores: Libido do Parceiro = 4,30. 


parte da caixa de dialogo options (opgoes). A 
diferenca significativa entre o grupo de alta 
dosagem e o placebo permanece, mas a dife¬ 
renca significativa entre os grupos de alta e 
baixa dosagem pelos parametros da regressao 
(Saida 9.3 do SPSS) desapareceu (p e somente 
0,14). Essa contradicao pode ser resultado de 
uma perda de poder nos testes post hoc (lem- 
bre que as comparacoes planejadas tem mais 
poder para detectar efeitos do que procedi- 
mentos post hoc). Entretanto, poderia haver 
outras razoes para essas comparacoes serem 
nao-significativas e devemos ter cautela nas 
nossas interpreta^Ses da significancia da AN¬ 
COVA e das comparacoes subsequentes. 

9.4.3 Interpretando as covariaveis © 

Ja mencionei que as estimativas dos pa¬ 
rametros (Saida 9.3 do SPSS) nos mostram 
como interpretar a covariavel. Se o valor de 
b para a covariavel for positivo, isso signifi- 
ca que a covariavel e a variavel de sai'da tem 
um relacionamento positivo (a medida que 
a covariavel aumenta, o valor de safda tam- 
bem aumenta). Se o valor de b for negativo 
significa o oposto: a covariavel e a variavel 
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Saida 9.6 do SPSS 

Pairwise Comparisons (Comparagoes aos pares) 


Dependent Variable: Libido (Variavel dependente: libido) 




Mean 
Difference 
(Diferenga 
Media)(l - J) 

Std. 

Error 

(Erro 

Padrao) 


95% Confidence Interval for 
Difference 8 (Intervalo de 95% 
de confianga para a diferenga) 

(!) Dose of Viagra 
(1) Dose de Viagra 

(J) Dose of Viagra 
(J) Dose de Viagra 

Sig. a 

Lower Bound 
(Limite inferior) 

Upper Bound 
(Limite Superior) 

Placebo (Placebo) 

Low Dose (Baixa 
Dosagem) 

0.287 

1.144 

0.992 

-2.631 

3.205 


High Dose (Alta 
Dosagem) 

-2.607* 

0.842 

0.014 

-4.756 

-0.458 

Low Dose (Baixa 

Placebo (Placebo) 

- 0.287 

1.144 

0.992 

-3.205 

2.631 

Dosagem) 

High Dose (Alta 
Dosagem) 

-2.894 

1.411 

0.144 

-6.493 

0.706 

High Dose (Alta 

Placebo (Placebo) 

2.607* 

0.842 

0.014 

0.458 

4.756 

Dosagem) 

Low Dose (Baixa 
Dosagem) 

2.894 

1.411 

0.144 

-0.706 

6.493 


Baseado nas medias marginais estimadas. 

* A diferenga media e significativa ao nfvel de 0,05. 
a. Ajuste para as comparagoes multiplas: Sidak. 


de saida tem um relacionamento negativo (a 
medida que a covariavel aumenta, a variavel 
de saida diminui). Para esses dados o valor de 
b foi positivo, indicando que a medida que a 
libido do parceiro aumenta, tambem aumenta 
a do participante. Outra maneira de descobrir 
a mesma coisa e simplesmente construir um 
diagrama de dispersao da covariavel contra a 
saida. Aprendemos sobre diagramas de dis¬ 
persao na Secao 4.4, entao de uma olhada la 
para descobrir como se faz um. A Figura 9.4 
mostra o diagrama de dispersao resultante 
para esses dados e confirma o que ja sabe- 
mos: o efeito da covariavel e que a medida 
que a libido do parceiro aumenta, o mesmo 
acontece com a libido do participante (como 
mostra a inclinagao da linha da regressao). 

9.5 ANCOVA EXECUTADA COMO UMA 
REGRESSAO MULTIPLA © 

Embora a ANCOVA esteja basicamente 
concluida, talvez seja interessante refazer a ana- 
lise como uma regressao miiltipla hierarquica. 
Como um exercicio, entre esses dados e condu- 
za uma analise voce mesmo acrescentando duas 
variaveis auxiliares ao arquivo ViagraCova- 


riate.sav que usamos 
neste capitulo (veja a 
Segao 8.2.2 para aju- 
da com a codificagao 
da variavel auxiliar). 

Se voce nao souber o 
que fazer, inclui um 
conjunto completo 
de dados chamado 
ViagraCovariate Dummy.sav no site www. 
artmed.com.br. Para conduzir a analise, usamos 
o procedimento de regressao (veja o Capitulo 5) 
com a libido como saida (variavel dependen¬ 
te na terminologia do SPSS), depois entramos 
com a libido do parceiro como um previsor no 
primeiro bloco (partner) e, entao, entramos 
com as duas variaveis dummies (auxiliares) no 
segundo bloco. Em todos os casos, o metodo de 
entrada deve ser o Enter (consulte a Segao 5.7 
para rever como entrar com variaveis em uma 
regressao hierarquica, mas lembre-se de usar o 
metodo Enter para ambos os blocos). O resumo 
do modelo de regressao resultante (Saida 9.7 do 
SPSS) mostra a aderencia do modelo primeiro 
quando somente a covariavel e usada e em se- 
guida quando tanto a covariavel quanto as varia¬ 
veis auxiliares sao utilizadas. 
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Figura 9.5 Diagrama de dispersao da libido do participante contra a libido do parceiro. 


Portanto, a diferenga entre os valores de R 2 
(0,313 - 0,058 = 0,255) representa a contribui- 
gao individual da dose de Viagra. Assim, pode- 
mos dizer que a dose de Viagra e responsavel 
por 25,5% da variagao na libido enquanto a libi¬ 
do do parceiro e responsavel por somente 5,8%. 
Essa informagao adicional fornece uma percep- 
gao sobre a importancia do Viagra. A proxima 
tabela e a da ANOVA, que e novamente dividi- 
da em duas secbes. A metade superior represen¬ 
ta apenas o efeito da covariavel e a metade infe¬ 
rior representa todo o modelo (isto e, incluindo 
a covariavel e as dosagens de Viagra). Note que 
na parte inferior da tabela da ANOVA (a parte 
do Modelo 2) todo o modelo (a libido do par¬ 
ceiro e as variaveis auxiliares) sao responsaveis 
por 34,57 unidades da variancia ( SS M ), existem 
110,97 unidades no total ( SS T ) e a variancia 
nao-explicada ( SS R ) e 76,22. A metade inferior, 
portanto, content os mesmos valores que a tabe¬ 
la resumo da ANCOVA da saida 9.2 do SPSS. 
Esses valores sao os mesmos da linha rotulada 


linha corrected model (modelo corrigido) da 
tabela resumo da ANCOVA que encontramos 
quando executamos a analise como ANCOVA 
(veja a Saida 9.2 do SPSS). 

A Saida 9.8 do SPSS mostra o restante 
da analise de regressao. Essa tabela de coe- 
ficientes de regressao e mais interessante. 
Novamente, essa tabela e dividida em duas e, 
assim, a parte inferior da tabela se parece com 
todo o modelo. Quando a dosagem do Viagra 
e considerada com a covariavel, o valor de h 
para a covariavel e 0,483, o que corresponde 
ao valor estimado do parametro na ANCOVA 
(Saida 9.3 do SPSS). Os valores de b para as 
variaveis auxiliares representam as diferengas 
entre as medias dos grupos de baixa dosagem 
e o grupo-placebo (dummy 1 - auxiliar 1) e 
o grupo de alta dosagem e o grupo-placebo 
(dummy2 - auxiliar 2) - veja a Segao 8.2.2 
para saber por que. As medias dos grupos de 
alta e baixa dosagem foram de 4,88 e 4,85, 
respectivamente, e a media do grupo-placebo 
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Saida 9.7 do SPSS 


Model Summary (Resumo do Modelo) 


Model 


R Square 

Adjusted R Square 

Std. Erro of the Estimate 

(Modelo) 

R 

(R ao Quadrado) 

(R ao Quadrado Ajustado) 

(Erro padrao da Estimativa) 

i 

0.240 a 

0.058 

0.024 

1.932 

2 

0.560 b 

0.313 

0.234 

1.712 


a. Previsores (Constante), Libido do parceiro. 

b. Previsores (Constante), Libido do parceiro, Variavel Auxiliar 1 (Placebo versus Alta Dosagem), Variavel Auxiliar 1 

c. Placebo versus baixa dosagem. 


ANOVA (Analise de Variancia) c 


Dependent Variable: Libido (Variavel dependente: libido) 


Mode / (Modelo) 

Sum of Squares 
(Soma dos quadrados) 

rff(gi) 

Mean Square (Media 
ao quadrado) 

F 

Sig. 

1 

Regression (Regressao) 

6.413 

1 

6.413 

1.717 

0.201 a 


Residual (Residuos) 

104.554 

28 

3.734 




Total (Total) 

110.967 

29 




2 

Regression (Regressao) 

34.750 

3 

11.583 

3.952 

0.019 b 


Residual (Residuos) 

76.216 

26 

2.931 




Total (Total) 

110.967 

29 





a. Previsores (Constante), Libido do parceiro. 

b. Previsores (Constante), Libido do parceiro, Variavel Auxiliar 1 (Placebo versus Alta Dosagem), Variavel Auxiliar 1 (Placebo 
versus Baixa Dosagem) 

c. Variavel dependente: Libido. 


Saida 9.8 do SPSS 


Coefficients a (Coeficientes) 



Unstandardized 
Coefficients (Coeficientes 
nao-padronizados) 

Standardized Coefficients 
(Coeficientes padronizados) 

t 

Sig. 

Model (Modelo) 

B 

Std. Error 
(Erro Padrao) 

Beta 



1 (Constant) (Constante) 

3.689 

0.626 


5.894 

0.000 

Partner's Libido (Libido do Parceiro) 

0.158 

0.120 

0.240 

1.311 

0.201 

2 (Constant) (Constante) 

1.236 

0.986 


1.253 

0.221 

Partner's Ubidol (Libido do Parceiro) 

0.483 

0.196 

0.737 

2.472 

0.020 

Dummy Variable 1 (Placebo vs. Low) 
(Variavel Auxiliar 1 (Placebo versus Bai¬ 
xa Dosagem) 

-0.287 

1.144 

-0.066 

-0.251 

0.804 

Dummy Variable 2 (Placebo vs. Low) 
(Variavel Auxiliar 2 (Placebo versus Alta 
Dosagem) 

2.607 

0.842 

0.672 

3.095 

0.005 


a. Variavel dependente: Libido. 


foi de 3,22. Portanto, os valores de b para as 
duas variaveis auxiliares devem ser aproxima- 
damente os mesmos (4,88 - 3,22 = 1,66 para 
dummyl (auxiliar 1) e 4,85 - 3,22 = 1,63 


para dummy2 (auxiliar 2)). Os mais espertos 
podem notar da salda do SPSS que, de fato, 
os valores de b nao sao somente muito dife- 
rentes entre si (o que nao deveria ser o caso 
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porque as medias do grupo de alta e baixa 
dosagem sao praticamente as mesmas), mas 
sao diferentes dos valores que acabei de cal- 
cular. Isso quer dizer que menti para voces nas 
ultimas 50 paginas sobre o que os valores de 
beta representam? Nao, eu nao sou tao horn- 
vel: essa aparente anormalidade ocorre porque 
os valores de b nessa regressao representam 
as diferen£as entre as medias ajustadas, nao 
as medias originais; isto e, a diferenca entre a 
media de cada grupo e o placebo quando essas 
medias foram ajustadas para a libido do par- 
ceiro. Os valores ajustados sao dados na saida 
9.5 do SPSS e dessa tabela podemos ver que: 


h = Y Y 

y Auxiliar 1 yv Baixa(ajustada) Placebo(ajustado) 


= 3,027 - 3,313 = —0,286 


h = y — y 

^Auxiliar 2 - /v Alta(ajustada) Placebo(ajustado) 

= 5,920-3,313 = -2,607 


(9.12) 


Esses sao os valores que voce pode ver na 
tabela do SPSS. Os testes t conduzidos nesses 
valores mostram que a significancia da AN- 
COVA foi resultado de uma diferenca signifi- 


cativa entre os grupos de alta dosagem e pla¬ 
cebo. 2 Nao havia diferenga significativa entre 
os grupos de baixa dosagem e do placebo. 
Voce deve notar, tambem, que a significancia 
dos valores de t e a mesma que vimos na tabe¬ 
la de contrastes na ANCOVA original (veja a 
saida 9.4 do SPSS). Finalmente, nos nao sa- 
bemos se havia uma diferenca entre os grupos 
de alta e baixa dosagem: para descobrir isso 
precisaremos usar diferentes codificagoes de 
variaveis auxiliares (talvez comparando a alta 
e a baixa com o placebo e, entao, comparan¬ 
do a alta com a baixa como faziamos para as 
comparagoes planejadas no Capitulo 8 - veja 
o Quadro 9.2). 


2 Como mencionei anteriormente neste capitulo, os graus 
de liberdade para esses testes t sao N-p - 1, como em 
qualquer analise de regressao (veja a Seijao 5.2.4). OiVe 
o numero do tamanho total da amostra (nesse caso, 30) e 
opto numero de previsores (nesse caso, 3, as duas va¬ 
riaveis auxiliares e a covariavel - veja a Equagao (9.1). 
Para esses dados, temos gl — 30 - 3 - 1 = 26. 



Quadro 9.2 


Contrastes planejados para a ANCOVA (D 

Voce deve ter notado que embora possamos solicitar ao SPSS que faga certos 
contrastes padrao, nao existe uma opgao para especificar contrastes planejados 
como havia com a ANOVA independente de um fator (veja a Segao 8.3.1). Entre- 
tanto, esses contrastes podem ser feitos se executarmos a ANCOVA por meio do 
menu da regressao. Imagine que voce escolha alguns contrastes planejados como 
no Capitulo 8, no qual o primeiro contraste comparou o grupo-placebo com todas 
as dosagens do Viagra e o segundo contraste comparou as dosagens alta e baixa (veja a Segao 
8.2.10). Vimos nas Segoes 8.2.10 e 8.3.1 que para fazer isso no SPSS precisamos entrar com certos 
numeros para codificar esses contrastes. Para o primeiro contraste, descobrimos que um conjunto 
apropriado de codigos seria -2 para o grupo-placebo e 1 para os grupos de dosagem alta e baixa. 
Para o segundo contraste, os codigos seriam 0 para o grupo-placebo, -1 para o grupo de dosagem 
baixa e 1 para o grupo de dosagem alta (veja a Tabela 8.4). Se voce quiser fazer esses contrastes 
para a ANCOVA, deve inserir esses valores como duas variaveis auxiliares (dummy). Assim, toman- 
do os dados desse exemplo, acrescentamos uma coluna chamada de Dummyl e naquela coluna 
colocamos o valor -2 para cada pessoa do grupo-placebo e o valor de 1 para os demais participan- 
tes. Precisamos, entao, acrescentar uma segunda coluna chamada de Dummy2 na qual colocamos 
um 0 para cada um dos participantes do grupo-placebo, -1 para todos no grupo de baixa dosagem 
e o valor de 1 para os do grupo de alta dosagem. Os dados completos seriam como os do arquivo 
ViagraCovariateContrasts.sav no site www.artmed.com.br. 

(Continua) 
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Quadro 9.2 ( Continuagao) 


Coefficients a (Coeficientes) 



Unstandardized 
Coefficients (Coeficientes 
nao-padronizados) 

Standardized 

Coefficients 

(Coeficientes 

padronizados) 



Model (Modelo) 

B 

Std. Error (Erro 
Padrao) 

Beta 

t 

Sig. 

1 (Constant) (Constante) 

3.689 

0.626 


5.894 

0.000 

Partner's Libidol (Libido do Parceiro) 

0.158 

0.120 

0.240 

1.311 

0.201 

2 (Constant) (Constante) 

2.009 

0.986 


2.038 

0.052 

Partner's Libido (Libido do Parceiro) 

0.483 

0.196 

0.737 

2.472 

0.020 

Dummy Variable 1 (Placebo vs. Low 8 
High) (Variavel Auxiliar 1 (Placebo versus 
Baixa e Alta)) 

0.387 

0.238 

0.276 

1.623 

0.117 

Dummy Variable 2 (Low vs. High) 
(Variavel Auxiliar 2 (Baixa versus Alta 
Dosagem)) 

1.447 

0.705 

0.617 

2.051 

0.050 



a. Variavel dependente: Libido. 

Execute a analise como descrito na Segao 9.5. A saida resultante ira iniciar com 
um resumo do modelo e uma tabela da ANOVA que deve ser identica aquelas na 
Saida 9.7 do SPSS (porque fizemos as mesmas coisas que anteriormente, a unica 
diferenga e como a variancia do modelo e subsequentemente separada com os 
contrastes). Os coeficientes de regressao para as variaveis auxiliares serao diferen- 
tes porque agora especificamos codigos distintos. 

A primeira variavel auxiliar compara o grupo-placebo com os grupos de alta e baixa dosagem. 
Assim, ela compara a media ajustada do grupo-placebo (3,313) com o valor medio das medias ajus- 
tadas para os grupos de baixa e alta dosagem (3,027 + 5,920)/2 = 4,474. 0 valor deb para a variavel 
auxiliar deve, portanto, ser diferente entre esses valores: 4,474 - 3.313 = 1,16. Entretanto, tambem 
descobrimos, numa segao complexa e chata (8.2.10.2) que esse valor e dividido pelo numero de gru¬ 
pos dentro do contraste (isto e, 3), assim, ele sera 1.16/3 = 0,387 (como ele sera na saida). A estatistica 
t associada nao e significativa, indicando que o grupo-placebo nao foi significativamente diferente da 
media combinada dos grupos do Viagra. 

A segunda variavel auxiliar compara os grupos de alta e baixa dosagem, e assim o valor de b deve 
ser a diferenga entre as medias ajustadas desses grupos: 5,920 - 3,027 = 2,89. Tambem descobrimos 
na Segao 8.2.10.2 que esse valor e dividido pelo numero dos grupos dentro do contraste (isto e, 2) e 
assim sera 2,89/2 = 1,447 (como na saida). A estatistica t associada e significativa (sua significance 
e exatamente 0,05), indicando que o grupo de alta dosagem produziu uma libido significativamente 
mais alta do que o grupo de baixa dosagem apos o controle do efeito da libido do parceiro. 

Isso ilustra como voce pode aplicar os princlpios da Segao 8.2.10 para a ANCOVA. Embora o 
SPSS nao fornega uma interface facil para fazer os contrastes planejados, eles podem ser feitos se 
voce usar os menus de regressao em vez dos da ANOVA! 


9.6 SUP0SIQ0ES ADICI0NAIS DA 
ANCOVA ® 

9.6.1 Homogeneidade dos parametros da 
regressao ® 

Quando uma ANCOVA e realizada, olha- 
mos para o relacionamento total entre a saida 


(variavel dependente) e a covariavel: ajustamos 
uma linha de regressao para todo o conjunto de 
dados, ignorando o grupo que a pessoa perten- 
ce. Ajustando esse modelo nos, portanto, as- 
sumimos que esse relacionamento e verdadei- 
ro para todos os grupos de participantes. Por 
exemplo, se existe um relacionamento positivo 
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entre a covariavel e a safda em um grupo, assu- 
mimos que existe um relacionamento positivo 
em todos os outros grupos tambem. Se, entre- 
tanto, o relacionamento entre a safda (variavel 
dependente) e a covariavel difere entre os gru¬ 
pos, todo o modelo de regressao nao e preci- 
so (ele nao representa todos os grupos). Essa 
suposigao e muito importante e e chamada de 
hipotese da homogeneidade dos parametros 
da regressao. A melhor maneira de entender 
essa suposigao e imaginar um diagrama de dis¬ 
persao para cada condicao experimental com 
a covariavel num eixo e a safda em outro. Se 
voce calculou e tragou a linha de regressao 
para cada um desses diagramas de dispersao, 


deve descobrir que as linhas de regressao sao 
mais ou menos semelhantes (isto e, os valores 
de b em cada grupo devem ser iguais). 

A Figura 9.5 mostra os diagramas de dis¬ 
persao que exibern o relacionamento entre a 
libido do parceiro (a covariavel) e a safda (a 
libido do participante) para cada uma das tres 
condigoes experimentais. Em cada diagrama 
de dispersao um ponto representa os dados 
de um participante especffico e as linhas sao 
os parametros de regressao para o grupo par¬ 
ticular (isto e, eles resumem o relacionamento 
entre a libido e a libido do parceiro mostrada 
pelos pontos). Deve ficar claro que existe um 
relacionamento positivo (as linhas dos para- 


Placebo Baixa Dosagem 





Regressao Linear 


Libido do Parceiro 


Figura 9.5 Diagrama de dispersao e linhas de regressao da libido do participante versus a libido 
do parceiro para cada uma das condigoes experimentais. 
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metros de regressao sobem da esquerda para a 
direita) entre a libido do parceiro e a libido do 
participate nas condigoes dos grupos-placebo 
e baixa dosagem. Entretanto, na condigao de 
alta dosagem parece nao haver relacao entre 
a libido dos participates e a dos parceiros 
(os pontos estao aleatoriamente espalhados e, 
na verdade, a linha do parametro de regressao 
desce da esquerda para a direita indicando uma 
relacao levemente negativa. Essa observacao 
nos fornece um indfcio para duvidar que exista 
uma homogeneidade nos parametros de disper- 
sao (porque o relacionamento entre a libido do 
participante e do seu parceiro nao e consistente 
entre os tres grupos-experimentais). 

9.6.2 Testando a homogeneidade 
dos parametros da 
regressao no SPSS © 

Para testar a hipotese da homogeneidade 
dos parametros da regressao precisamos exe- 
cutar novamente a ANCOVA, mas dessa vez 
utilizando um modelo customizado. Acesse a 
caixa de dialogo principal como anteriormen- 
te e coloque as variaveis nos mesmos quadras 
que antes (a janela final deve ficar como a da 
Figura 9.1). Para customizar o modelo preci¬ 
samos acessar a caixa de dialogo model (Fi¬ 
gura 9.6) clicando em Mod «' (modelo). 


Para customizar o modelo, clique no cfr- 
culo rotulado de Custom (Customizar) a fim 
de ativar a caixa de dialogo (Figura 9.6). As 
variaveis especificadas na caixa de dialogo 
principal estao listadas no lado esquerdo e sao 
seguidas por uma letra indicando o seu tipo 
(F = fator fixo, C = covariavel). Para testar 
a homogeneidade dos parametros da regres¬ 
sao, precisamos especificar um modelo que 
inclui a interagao entre a covariavel e a varia- 
vel dependente. Normalmente, a ANCOVA 
inclui somente o efeito principal da dosagem 
e parceiro e nao inclui o termo de interacao. 
Para testar o termo de interacao e importante 
incluir os efeitos principals de dosagem e par¬ 
ceiros a fim de que o termo de interacao seja 
testado controlando os efeitos principals. 

Portanto, comece selecionando dose e 
partner (parceiro)(voce pode selecionar am- 
bos ao mesmo tempo). Onde diz Build Term(s) 
(Construir Termo(s)) existe um menu tipo lis- 
ta de escolha. Clique em > ! para acessar esse 
menu e, depois, clique em Main effects (Efei¬ 
tos principals). Clique em ' J a fim de mover 
os efeitos principals de dose e partner para o 
quadra denominado Model (Modelo). Depois 
precisamos especificar o termo de interagao. 
Para tanto, selecione dose e partner ao mes¬ 
mo tempo e clique em zl para acessar o menu 
tipo lista de escolha novamente, mas dessa vez 



Figura 9.6 Caixa de dialogo Mode / (Modelo) do MLG univariado. 
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selecione Interaction (Interacao). Clique em 
’ I para mover a interacao de dose e partner 
para a caixa rotulada de Model (Modelo). A 
caixa de dialogo final deve ficar igual a da 
Figura 9.6. Voce pode descobrir mais sobre 
como especificar efeitos na Segao 10.3.2. Ten- 
do especificado os dois efeitos principals e o 


termo de interacao, clique em 
^ (continuar) para retornar 
a caixa de dialogo principal e, 
entao, em °« para executar a 
analise. 

A Saida 9.9 do SPSS mostra a tabela de 
resumo principal para a ANCOVA incluindo o 



Saida 9.9 do SPSS 

Tests of Between-Subjects Effects (Testes de efeitos entre participantes) 


Dependent Variable: Libido (Variavel Dependente: Libido) 


Source (Fonte) 

Tipe III Sum of 
Squares (Soma dos 
quadrados do tipo III) 

cfflgi) 

Mean Square 
(Media ao 
quadrado) 

F 

Sig. 

Corrected Model (Modelo Corrigido) 

52.000 3 

5 

10.400 

4.233 

0.007 

Intercept (Intercepto) 

1.706 

1 

1.706 

0.694 

0.413 

DOSE (Dose) 

40.068 

2 

20.034 

8.154 

0.002 

Partner (Parceiro) 

22.430 

1 

22.430 

9.129 

0.006 

Dose * Partner (Dose * Parceiro) 

17.250 

2 

8.625 

3.510 

0.046 

Error (Erro) 

58.967 

24 

2.457 



Total (Total) 

683.000 

30 




Corrected Total (Total corrigido) 

110.967 

29 





a. R quadrado = 0,469 (R quadrado ajustado = 0,358). 


f -;- 

Dica da Samanta Ferrinho 





V. 


• A Analise de Covariancia (ANCOVA) compara varias medias, mas com con- 
trole do efeito de outras variaveis (uma ou mais), denominadas covariaveis; 
por exemplo, se voce tern varias condigoes experimentais e quer controlar a 
idade dos participantes. 

• Na tabela denominada Tests of between-subjects effects (Testes entre os 
efeitos dos participantes), olhe para a coluna denominada Sig. tanto para a 
covariavel quanto para a variavel independente (a variavel de agrupamento); 
se o valor for menor do que 0,05, isso significa que a covariavel tern relagao 
significativa com a variavel de saida (a variavel dependente); para a variavel de 
agrupamento, isso significa que as medias dos grupos sao significativamente 
diferentes apos o controle para o efeito que a covariavel tern na saida. 

• Como ocorreu com a ANOVA, se voce gerou hipoteses especificas antes do ex- 
perimento, utilize as comparagoes planejadas (plannedcomparisons)', se voce 
nao tern hipoteses especificas, utilize os testes post hoc. Embora o SPSS deixe 
voce especificar certos contrastes padrao, outras comparagoes planejadas de- 
verao ser feitas com o recurso do procedimento da regressao no SPSS. 

• Para contrastes e testes post hoc, consulte a coluna denominada Sig. para 
descobrir se suas comparagoes sao significativas (isso ira ocorrer se o valor 
da significance for menor do que 0,05). 

• Teste as mesmas hipoteses que foram feitas para a ANOVA, mas, alem disso, 
teste a hipotese da homogeneidade dos parametros da regressao. Isso deve 
ser feito customizando o modelo da ANCOVA no SPSS. 


J 
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termo de interagao. Os efeitos da dosagem do 
Viagra e a libido do parceiro continuam signi- 
ficativos, mas estamos interessados mesmo e 
no termo de interagao. Assim, olhe para o va¬ 
lor de significance da covariavel da saida da 
interagao (dose*partner); se esse efeito e sig- 
nificativo, a hipotese da homogeneidade dos 
parametros da regressao foi violada. O efeito 
aqui e significativo (p < 0,05); portanto, a hi¬ 
potese nao e sustentavel. Embora esse achado 
nao seja surpreendente devido ao padrao dos 
relacionamentos mostrados na Figura 9.5, ele 
gera certa preocupagao sobre a analise prin¬ 
cipal, especialmente a luz dos achados con- 
traditorios das comparagoes miiltiplas. Esse 
exemplo ilustra porque e importante testar as 
hipoteses e nao simplesmente aceitar os resul- 
tados de uma analise. 

9.7 CALCULANDO 0 TAMANHO DE 
EFEITO © 

Vimos no Quadro 9.1 que podemos fazer 
o SPSS produzir o eta quadrado (rf ), o que e 
apenas o r 2 calculado do efeito entre grupos, 
SS M , dividido pela variancia total dos dados, 
SS T . Essa medida do tamanho de efeito e leve- 
mente tendenciosa, por isso recomendo nao 
usa-la. Como ocorre com a ANOVA, e re- 
comendavel utilizar o omega quadrado (co 1 ), 
uma versao menos tendenciosa do eta quadra¬ 
do (veja a Segao 8.5). Entretanto, como vimos 
na Segao 8.5, ele somente pode ser calculado 
quando tivermos um mesmo numero de par- 
ticipantes em cada grupo (e nao temos isto 
aqui!). Assim, estamos um pouco confusos! 

Mas nem tudo esta perdido porque, como 
eu ja disse muitas vezes, o tamanho de efeito 
global nao e tao interessante quanto o tamanho 
de efeito para comparagoes mais especfficas. 
Essas sao faceis de calcular porque seleciona- 
mos parametros de regressao (veja a Saida do 
SPSS 9.3) e, assim, temos a estatistica t para a 
covariavel e comparagoes entre os grupos de 
baixa e alta dosagem e dos grupos-placebo e 
de alta dosagem. Essas estatfsticas t tern A - 2 
graus de liberdade (veja o Capftulo 5), onde 
N 6 o tamanho total da amostra (nesse caso, 


30). Podemos usar a mesma equagao da Se¬ 
gao 7.5.5. 3 



Portanto, obtemos (fs da Saida 9.3 do 
SPSS): 


2,47 2 


2,47 2 + 28 


6,10 


134,10 
= 0,42 


'Alta Dosagem vs. Placebo 


-3,095 2 


—3,095 2 + 28 


9,58 

37,57 

0,50 


'Alta Dosagem vs. Baixa 


-2,051 2 


-2,051 2 + 28 


4,21 


132,21 
= 0,36 


Todos esses efeitos apresentam tamanhos 
de efeito de medio a grande (eles estao entre 
0,3 e 0,5). Portanto, alem de serem estatistica- 
mente significativos, esses efeitos sao desco- 
bertas importantes. 


9.8 RELATAND0 RESULTADOS © 

Relatar a ANCOVA e o mesmo que relatar 
uma ANOVA, exceto que precisamos relatar o 
efeito da covariavel tambem. Para a covariavel e 
o efeito experimental, fornecemos detalhes so¬ 
bre a razao F e os graus de liberdade dos quais 


3 A rigor, devemos usar um procedimento um pouco mais 
elaborado quando os grupos nao sao iguais. Mas isto 
esta fora do ambito do livro. Rosnow, Rosenthal e Rubin 
(2000) fomecem um relato muito claro dessa siluacao. 
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ele foi calculado. Em ambos os casos, a razao 
F foi derivada pela divisao da media dos qua- 
drados do efeito pela media dos quadrados do 
resfduo. Portanto, os graus de liberdade usados 
para avaliar a razao F sao os graus de liberdade 
do efeito do modelo ( gl M = 1 para a covariavel 
e 2 para o efeito experimental) e os graus de 
liberdade para os residuos do modelo (gl^ = 26 
para a covariavel e para o efeito experimental) 
- veja a Saida 9.2 do SPSS. Portanto, a maneira 
correta de relatar a descoberta principal seria: 

• A covariavel, libido do parceiro, esta sig- 
nificativamente relacionada com a libido 
do participante, F( 1, 26) = 6,ll,p < 0,05, 
r = 0,42. Tambem houve um significativo 
efeito do Viagra nos niveis da libido apos 
o controle para o efeito da libido do par¬ 
ceiro, F( 2, 26) = 4,83, p < 0,05. 

Podemos, tambem, relatar alguns con- 
trastes: 

• Contrastes planejados revelaram que to- 
mar uma dosagem alta de Viagra aumentou 
significativamente a libido em comparagao 
tanto ao grupo-placebo, t(26) = — 3,10, p < 
0,05, r = 0,50 quanto ao grupo de baixa do¬ 
sagem, f(26) = —2,05, p < 0,05, r = 0,36. 

9.9 0 QUE DESC0BRIM0S S0BRE 
ESTATISTICA? © 

Este capitulo mostrou como o modelo li¬ 
near generalizado (MLG), descrito no Capitu¬ 
lo 8, pode ser estendido para incluir variaveis 
adicionais. As vantagens de fazer isso sao que 
podemos manter o controle sobre os fatores 
em vez de manipular experimentalmente o que 
poderia influenciar nossa medida de saida. Isso 
nos da um controle experimental mais restrito 
e pode, tambem, ajudar a explicar alguma par¬ 
te da nossa variancia do erro, fornecendo uma 
medida mais pura da manipulacao experimen¬ 
tal. Nao vimos muita teoria sobre a ANCOVA, 
apenas aprendemos conceitualmente como o 
modelo de regressao pode ser expandido para 
incluir essas variaveis adicionais ( covaridveis ). 
Em vez disso, fomos direto ao exemplo, que foi 


observar o efeito do Viagra na libido (como no 
Capitulo 8), mas incluindo a libido do parcei¬ 
ro como uma covariavel. Expliquei como fazer 
a analise no SPSS e interpretar os resultados, 
mas tambem mostrei como a mesma saida 
poderia ser obtida executando a analise como 
uma regressao. Isso foi feito para mostrar que 
tanto a ANOVA quanto a ANCOVA sao ape¬ 
nas formas de regressao! De qualquer modo, 
acabamos observando uma hipotese adicional 
que deve ser considerada quando realizando a 
ANCOVA: a hipotese da homogeneidade dos 
parametros da regressao. Isso simplesmente 
significa que o relacionamento entre a cova¬ 
riavel e a variavel da saida deve ser o mesmo 
em todos os grupos-experimentais. Tambem 
vimos como testar essa hipotese no SPSS. Nos 
proximos capitulos iremos observar situaqdes 
em que teremos mais do que uma manipulacao 
experimental. 

9.10 TERM0S-CHAVE QUE 
DESC0BRIM0S 

• Media ajustadas 

• Analise da covariancia (ANCOVA) 

• Homogeneidade dos parametros da re¬ 
gressao 

• Controlar 

• Corre^ao de Sidak 

• Covariaveis 

9.11 TAREFAS DO ALEX ESPERT0 

• Tarefa 1: Ser perseguido e uma 
experiencia muito perturbadora 
e incomoda (para a pessoa per- 
seguida) na qual alguem (o per- 
seguidor) constantemente asse- 
dia ou e obcecado por outra pessoa. Ela 
pode assumir muitas formas, desde o envio 
de cartas ameacando matar seu gato se voce 
nao retribuir o amor que o perseguidor tern 
por voce a literalmente segui-lo por toda 
parte numa tentativa desesperada de ver 
qual CD voce compra num sabado (como 
se fosse qualquer outro alem do Fugazi!). 
Um psicologo, que cansou de ser persegui- 
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do por pessoas, decidiu tentar duas terapias 
diferentes em diferentes grupos de perse- 
guidores (25 perseguidores em cada grupo 
- essa variavel e chamada de Group (Gru¬ 
po)). Ao primeiro grupo de perseguidores 
ele deu o que chamou de terapia cruel-para- 
ser-gentil. Essa terapia era baseada em pu- 
nigao para comportamentos de perseguigao; 
resumindo, cada vez que o perseguidor o 
seguia ou mandava uma carta o psicologo o 
atacava com um choque eletrico ate ele pa- 
rar com o comportamento de perseguigao. 
Com isso, era esperado que os perseguido¬ 
res tivessem uma reagao contraria a qual- 
quer coisa que lembrasse perseguigao. A 
segunda terapia era a psicodinamica, uma 
vertente recente da terapia psicodinamica 
de Freud que reconhece a farsa que e esse 
tipo de tratamento (ou seja, voce poderia 
dizer que ela e baseada na teoria de Freud!). 
Os perseguidores eram hipnotizados e re- 
grediam a sua infancia, e o terapeuta tam- 
bem discutia o penis (a nao ser que fosse 
mulher; nesse caso, eles discutiam a falta 
dele), o penis do seu pai, o penis do seu ca- 
chorro, o penis do gato da rua e o penis de 
quern viesse a sua cabega. No final da tera¬ 
pia, o psicologo media o numero de horas 
na semana que o perseguidor gastava perse- 
guindo a sua presa (essa variavel e chamada 
de stalk2 (perseguir2)). O psicologo acre- 
ditava que o sucesso da terapia, para come- 
gar, dependia de quao grave era o problema, 
assim, antes da terapia ele media o numero 
de horas que o paciente gastava perseguin- 
do como um indicador do quanto a pessoa 
perseguia (essa variavel e chamada de 
stalkl (perseguirl)). Os dados estao no ar- 
quivo Stalker.sav. Analise o efeito da tera¬ 
pia no comportamento de perseguigao apos 
a terapia, controlando o total do comporta¬ 
mento de perseguigao antes da terapia. © 

• Tarefa 2: Um gerente de marketing de uma 
conhecida companhia de bebidas estava 


interessado nos beneffcios terapeuticos de 
certos refrigerantes na cura de ressacas. Ele 
levou 15 pessoas para sair de noite e as em- 
bebedou. Quando acordaram na manha se- 
guinte, desidratados, ele deu para cinco de¬ 
les agua, para outros cinco Lucozade (uma 
gostosa bebida inglesa a base de glicose) e 
aos cinco restantes uma marca lfder de cola 
(essa variavel e chamada de drink (bebi¬ 
da)). Ele mediu a sensagao de bem-estar 
(numa escala de 0 = eu me sinto como se 
estivesse morto a 10 = eu me sinto sauda- 
vel) duas horas mais tarde (essa variavel e 
chamada de well (bem)). O gerente queria 
saber qual bebida produziu o maior nfvel 
bem-estar. Entretanto, ele se deu conta de 
que era importante controlar o quao beba- 
do a pessoa tinha ficado na noite anterior, 
e mediu isso numa escala de 0 (= tao so- 
brio quanto uma freira) a 10 (= se debaten- 
do como um peixe fora da agua, no chao, 
numa poga do seu proprio vomito). Os da¬ 
dos estao no arquivo HangoverCure.sav. 
Realize uma ANCOVA para ver se as pes¬ 
soas se sentiram melhores depois de tomar 
as diferentes bebidas quando controlado o 
quao bebados estavam na noite anterior. © 
As respostas estao no arquivo Answers 
(Chapter 9).pdf e a tarefa 1 tern uma interpre- 
tagao completa em Field e Hole (2003). 

9.12 LEITURAS COMPLEMENTARES 

HOWELL, D. C. Statistical methods for psychology. 

Belmont (CA): Duxbury, 2002. 5 a Ed. Capltulo 16. 
RUTHERFORD, A. Introducing ANOVA and 

ANCOVA: A GLM Approcah. London: Sage, 2000. 
WILDT, A. R., AHTOLA, O. Analysis of covariance. 
Sage University paper series on quantitative 
applications in the social sciences. 07-12. 

Newbury Park (CA): Sage, 1978. Esse texto e de 
alto nfvel e bastante completo se voce quiser saber 
sobre a matematica por tras da ANCOVA. 



10 

ANOVA FATORIAL (MLG 3) 


10.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 

Nos dois capftulos anteriores, vimos situa¬ 
goes nas quais tentamos testar diferengas entre 
grupos quando havia uma unica variavel indepen- 
dente (isto e, uma variavel que havia sido mani- 
pulada). Entretanto, no inicio do Capi'tulo 8, afir- 
mei que uma das vantagens da ANOVA era que 
poderfamos olhar para os efeitos de mais de uma 
variavel independente (e como essas variaveis in- 
teragem). Este capftulo estende o que ja sabemos 
sobre ANOVA a observagao de situagoes onde 
existem duas variaveis independentes. Ja vimos 
no capi'tulo anterior que e muito facil incorpo- 
rar uma segunda variavel a estrutura da ANOVA 
quando aquela variavel e uma variavel contfnua 
(isto e, nao dividida em grupos), mas agora ire- 
mos ver situagoes onde existe uma segunda varia¬ 
vel independente sistematicamente manipulada 
designando pessoas a diferentes situagoes. 

10.2 TEORIA DA ANOVA FATORIAL 
(ENTRE GRUPOS) © 

10.2.1 Delineamentos fatoriais © 

A ANOVA fatorial e usada quando voce 
tem duas ou mais variaveis independentes 


(essas variaveis sao, as ve- 
zes, denominadas fatores, 
por isso o nome ANOVA 
fatorial). Existem varios 
tipos de delineamentos fa¬ 
toriais: 

• Delineamento fato¬ 
rial independente: 

Quando existem diversas variaveis inde¬ 
pendentes ou previsoras e cada uma foi 
mensurada usando participantes diferen¬ 
tes (entre grupos). 

• Delineamento fatorial relacionado: 
Quando diversas variaveis independentes 
ou previsoras foram mensuradas, mas os 
mesmos participantes foram usados em 
todas as condigoes (medidas repetidas). 

• Delineamento misto: Quando diversas 
variaveis independentes (ou previsoras) 
foram mensuradas; algumas foram men¬ 
suradas com diferentes participantes e ou- 
tras usaram os mesmos participantes. 

Esta segao estende a ANOVA de um fator 
para o caso fatorial e os capftulos subsequen- 
tes aos delineamentos de medidas repetidas, 
delineamentos fatoriais de medidas repetidas 
e finalmente, delineamentos misturados. 
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Quadro 10.1 


Nomeando ANOVAs © 

As ANOVAs podem ser bem confusas porque existem muitas delas. Voce ira, frequentemente, 
se deparar com afirmagoes como "uma ANOVA de dois fatores independente foi conduzida" ou 
"lima ANOVA de medidas repetidas de dois fatores foi conduzida" em periodicos. Essas afirma¬ 
goes podem parecer confusas, mas na verdade elas sao bem faceis. Todas as ANOVAs tern duas 
coisas em comum: elas envolvem uma quantidade de variaveis independentes e essas variaveis 
podem ser mensuradas usando os mesmos ou diferentes participantes. Se os mesmos participan- 
tes foram usados, geralmente usamos a frase medidas repetidas, e se diferentes participantes fo- 
ram utilizados, usamos a palavra independente. Quando existem duas ou mais variaveis indepen¬ 
dentes, e possivel que algumas variaveis usem os mesmos participantes enquanto outras usem 
diferentes participantes. Nesse caso, usamos a palavra mista. Quando nomeamos uma ANOVA 
estamos, simplesmente, dizendo ao leitor quantas variaveis independentes usamos e como elas 
foram mensuradas. Em termos gerais, podemos escrever o nome de uma ANOVA como: 

• Uma (numero de varaveis independentes) maneira como essas variaveis foram medidas 
pela ANOVA 

Lembrando isso voce pode entender o nome de qualquer ANOVA que aparecer. Veja esses 
exemplos e tente descobrir quantas variaveis foram usadas e como elas foram mensuradas: 

• ANOVA de um fator independente. 

• ANOVA de dois fatores de medidas repetidas. 

• ANOVA de dois fatores mista. 

• ANOVA de tres fatores independentes. 

As repostas deveriam ser: 

• Uma variavel independente mensurada usando participantes diferentes. 

• Duas variaveis independentes, ambas mensuradas usando os mesmos participantes. 

• Duas variaveis independentes: uma mensurada usando participantes diferentes e a outra 
mensurada usando os mesmos participantes. 

• Tres variaveis independentes, todas mensuradas usando participantes diferentes. 


10.2.2 Um exemplo com duas variaveis 
independentes © 

Ao longo deste capitulo, usaremos um 
exemplo que tern duas variaveis independen¬ 
tes. Isso e conhecido como a ANOVA de dois 
fatores. Voce vera as ANOVAs referidas como 
de um fator, de dois fatores, de tres fatores e 
assim por diante e o numero antes da palavra 
“fatores”nos diz quantas variaveis independen¬ 
tes havia: um fator tern uma variavel indepen¬ 
dente, tres fatores tem tres (veja o Quadro 10.1). 
De qualquer modo, ftcaremos com duas. Uma 
antropologista estava interessada nos efeitos do 
alcool na selegao de acompanhantes em uma 
boate. Seu fundamento era que apos o consu- 


rno do alcool, percepgdes subjetivas de atrativos 
ffsicos se tornariam menos precisas (o famoso 
efeito do alcool - “Nao ha gente feia voce e que 
bebeu pouco”). Ela tambem estava interessada 
em saber se esse efeito era diferente para ho- 
mens e mulheres. Ela escolheu 48 estudantes: 
24 homens e 24 mulheres. Ela, entao, levou 
grupos de oito participantes a uma boate e nao 
deu alcool para eles (os participantes recebe- 
ram drinques placebo de cerveja sem alcool), 2 
canecas de uma cerveja forte ou 4 canecas* de 


* N. de T.: Medida de capacidade utilizada em alguns 
pafses da Europa (especialmente Gra-Bretanha) e Esta- 
dos Unidos. Na Gra-Bretanha, ela equivale a 568 ml e 
nos Estados Unidos, 473 ml. Esses valores podem variar 
em outros pafses. 
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Tabela 10.1 

Dados para o efeito alcool (voce e que bebeu pouco) 



Alcool 

Nada 

2 Canecas 1 

4 Canecas 

Genero 

Feminino 

Masculino 

Feminino 

Masculino 

Feminino 

Masculino 


65 

50 

70 

45 

55 

30 


70 

55 

65 

60 

65 

30 


60 

80 

60 

85 

70 

30 


60 

65 

70 

65 

55 

55 


60 

70 

65 

70 

55 

35 


55 

75 

60 

70 

60 

20 


60 

75 

60 

80 

50 

45 


55 

65 

50 

60 

50 

40 

Total 

485 

535 

500 

535 

460 

285 

Media 

60,625 

66,875 

62,50 

66,875 

57,50 

35,625 

Variancia 

24,55 

106,70 

42,86 

156,70 

50,00 

117,41 


1. Uma caneca = 1 Pint 


uma cerveja forte. No final da noite, ela tirou 
uma foto da pessoa com quern o participante es- 
tava conversando. Depois, reuniu um grupo de 
jufzes independentes para avaliar a atratividade 
da pessoa em cada fotografia (numa escala de 
0 de 100). Os dados estao na Tabela 10.1 e no 
arquivo goggles.sav. 

10.2.3 A Soma total dos Quadrados 
(SS T ) © 

A ANOVA de dois fatores 
e conceitualmente muito simi¬ 
lar a ANOVA de um fator. Ba- 
sicamente, nos ainda encontra- 
mos o total da soma dos erros 
ao quadrado (SS X ) e decompomos essa varian- 
cia em uma variancia que pode ser explicada 
pelo experimento (SS M ) e uma variancia que 
nao pode ser explicada (SS R ). Entretanto, na 
ANOVA de dois fatores, a variancia explicada 
pelo modelo e feita nao somente por uma ma- 
nipulagao experimental, mas duas. Portanto, 
decompomos a soma dos quadrados do mode¬ 
lo em uma variancia explicada pela primeira 
variavel independente (SS A ), uma variancia 
explicada pela segunda variavel independente 
(SS B ) e uma variancia explicada pela interagao 
dessas duas variaveis (SS AxB ). 

Basicamente, comegamos da mesma for¬ 
ma como fizemos com a ANOVA de um fator. 


Isto e, calculamos quanta variabilidade existe 
entre os escores quando ignoramos a condigao 
experimental a que eles pertencem. Lembre a 
ANOVA de um fator (Equagao 8.4) que a SS T 
e calculada utilizando a seguinte equagao: 

SS T = s 2 total (N- 1) 

A variancia total e simplesmente a varian¬ 
cia de todos os escores quando ignoramos o 
grupo ao qual eles pertencem. Assim, se tra- 
tarmos os dados como um grande grupo, eles 
ficarao da seguinte forma: 


65 

50 

70 

45 

55 

30 

70 

55 

65 

60 

65 

30 

60 

80 

60 

85 

70 

30 

60 

65 

70 

65 

55 

55 

60 

70 

65 

70 

55 

35 

55 

75 

60 

70 

60 

20 

60 

75 

60 

80 

50 

45 

55 

65 

50 

60 

50 

40 


Media Geral = 58,33 


Se calcularmos a variancia de todos esses 
escores, teremos 190,78 (tente isso na sua cal- 
culadora se voce nao confia em mim). Usamos 
48 escores para gerar esse valor e, assim, N e 
48. Dessa forma, a equagao anterior fica: 

ss T = 4, tal (v-i) 

= 190,78(48- 1) 

= 8966,66 
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Os graus de liberdade para esse SS sera 
N- 1, ou 47. 


10.2.4 A Soma dos Quadrados do 
Modelo (SSJ © 

O proximo passo e calcular a soma dos 
quadrados do modelo. Como sugeri antes, essa 
soma dos quadrados e, entao, dividida em tres 
componentes: a variancia explicada pela pri- 
meira variavel independente (SS A ), a variancia 
explicada pela segunda variavel independente 
(SS B ) e a variancia explicada pela interacao 
dessas duas variaveis (SS A x B ). 

Antes de dividirmos a soma dos quadrados 
do modelo em suas partes componentes, pri- 
meiro precisamos determina-la. Temos agora 
8966,66 unidades de variancia total para serem 
explicadas e nosso primeiro passo e determinar 
o quanto dessa variancia e explicada pelo total 
das nossas manipulates experimentais (igno- 
rando qual das duas variaveis independentes e 
responsavel). Quando fizemos a ANOVA de um 
fator calculamos a soma dos quadrados do mo¬ 
delo verificando a difercnca entre a media de 
cada grupo e a media total (veja a Se^ao 8.2.5). 
Podemos fazer o mesmo aqui. Efetivamente te¬ 
mos seis grupos-experimentais se combinarmos 
todos os niveis das duas variaveis independen¬ 
tes (tres doses para os participantes masculinos 
e tres doses para os femininos). Assim, dado 
que temos seis grupos de pessoas diferentes po¬ 
demos aplicar a equagao para a soma dos qua¬ 
drados do modelo que usamos para a ANOVA 
de um fator (Equagao 8.5): 

SS M = 'Y2 H k ( X k ~ ^geral) 

A media geral e a media de todos os es- 
cores (acima, calculamos isso como sendo 
58,33) e n k e o numero de escores em cada 
grupo (isto e, o numero de participantes em 
cada um dos seis grupos-experimentais; oito 
nesse caso). Portanto, a equate fica: 

SS M = 8(60,625 - 58,33) 2 + 8(66,875 - 58,33) 2 
+ 8(62,500 - 58,33) 2 + 8(66,875 
- 58,33) 2 + 8(57,500 - 58,33) 2 
+ 8(35,625 - 58,33) 2 


= 8(2,295) 2 + 8(8,545) 2 + 8(4,17) 2 + 
8(8,545) 2 + 8(—0,83) 2 + 8(-22,705) 2 

= 42,1362 + 584,1362+ 139,1112 
+ 584,1362 + 5,5112 + 4124,1362 

= 5479,167 

Os graus de liberdade para essa SS sera 
o numero de grupos usados, k, menos 1. Nos 
usamos seis grupos, assim, gl = 5. 

Nesse estagio, sabemos que o modelo (nos¬ 
sas manipulates experimentais) podem expli- 
car 5479,167 unidades da variancia do total de 
8966,66 unidades. O proximo estagio e dividir 
essa soma dos quadrados do modelo para ver 
quanta variancia e explicada pelas nossas varia¬ 
veis independentes separadamente. 

10.2.4.1 0 efeito principal do Genero (SS A ) © 

Para calcular a variancia de responsabili- 
dade da primeira variavel independente (nesse 
caso, genero), precisamos agrupar os escores 
no conjunto de dados de acordo com o genero a 
que pertencem. Assim, basicamente, ignoramos 
a quantidade de bebida que foi ingerida e colo- 
camos todos os escores masculinos em um gru¬ 
po e todos os escores femininos em outro grupo. 
Assim, os dados ficarao dessa maneira (note 
que o primeiro quadra content as tres colunas 
femininas da nossa tabela original e o segundo 
quadra content as tres colunas masculinas): 



A, Feminino 



A 2 Masculino 

65 

70 

55 


50 

45 30 

70 

65 

65 


55 

60 30 

60 

60 

70 


80 

85 30 

60 

70 

55 


65 

65 55 

60 

65 

55 


70 

70 35 

55 

60 

60 


75 

70 20 

60 

60 

50 


75 

80 45 

55 

50 

50 


65 

60 40 


Media Feminina Media Masculina 

= 60,21 = 56,46 


Podemos, entao, aplicar a cquacao para a 
soma dos quadrados do modelo que usamos 
para calcular a soma total dos quadrados: 

SS A=XX^ _J geral ) 2 
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A media geral e a media de todos os esco- 
res (acima) en k eo numero dos escores em cada 
grnpo (isto e, o numero de homens e mulheres: 
24 nesse caso). Portanto, a equagao fica: 

SS G6nero = 24(60,21 - 58,33) 2 + 24(56,46 
- 58,33) 2 

= 24(1,88) 2 + 24(-l, 87) 2 
= 84,8256 + 83,9256 
= 168,75 

Os graus de liberdade para esse SS sera 
o numero de grupos usados, k, menos 1. Usa- 
mos dois grupos (masculinos e femininos), 
assim, gl = 1. 

10.2.4.2 0 efeito principal do Alcool (SS B ) © 

Para calcular a variancia de responsabili- 
dade da segunda variavel independente (nesse 
caso, alcool) precisamos agrupar os escores 
do conjunto de dados original de acordo com 
a quantidade de alcool ingerida. Assim, basi- 
camente ignoramos o genera do participante e 
apenas colocamos todos os escores sem bebida 
em um grupo, os escores dos que tomaram 2 
canecas em outro grupo e os escores dos que 
tomaram 4 canecas num terceiro grupo. Assim, 
os dados ficarao com a seguinte aparencia: 


B,: Sem bebida 

65 

50 

70 

55 

60 

80 

60 

65 

60 

70 

55 

75 

60 

75 

55 

65 


B 2 : 2 canecas 

70 

45 

65 

60 

60 

85 

70 

65 

65 

70 

60 

70 

60 

80 

50 

60 


B 3 : 4 canecas 

55 

30 

65 

30 

70 

30 

55 

55 

55 

35 

60 

20 

50 

45 

50 

40 


Media sem Media apos Media apos 
bebida = 2 canecas 4 canecas 

63,75 = 64,6875 = 46,5625 

Podemos, entao, aplicar a mesma equa¬ 
gao para a soma dos quadrados do modelo que 
usamos para o total da soma dos quadrados do 
modelo e para o efeito principal de genera: 

SS B = T. n k ( x k — X geral)~ 


A media geral e a media de todos os es¬ 
cores (58,33 como antes) e%eo numero dos 
escores em cada grupo (isto e, o numero dos 
escores em cada um dos quadras acima, nesse 
caso, 16). Portanto, a equagao fica: 

SSaicooi = 16(63,75 - 58,33) 2 + 16(64,6875 
- 58,33) 2 + 16(46,5625 - 58,33) 2 
= 16(5,42) 2 + 16(6,3575) 2 
+ 16(—11,7675) 2 

= 470,0224 + 646,6849 + 2215,5849 
= 3332,292 

Os graus de liberdade para essa SS sera 
o numero de grupos usados menos 1 (veja a 
Segao 8.2.5 da ANOVA de um fator). Usamos 
tres grupos e, assim, gl= 2. 

10.2.4.3 0 efeito interagao (SS AxB ) © 

O estagio final e calcular quanto da va¬ 
riancia e explicada pela interagao das duas 
variaveis. A maneira mais facil de fazer isso e 
lembrar que a SS M e constiturda de tres com- 
ponentes (SS A , SS B e SS AxB ); portanto, dado 
que conhecemos SS A e SS B podemos calcular 
o termo de interagao usando a subtragao: 

SS AxB = SS M — SS A — SS B 

Portanto, para esses dados, o valor e: 

ss AxB = SS M — SS A — SS B 

= 5479,167 - 168,75 - 3332,292 
= 1978,125 

Os graus de liberdade podem ser calcu- 
lados da mesma maneira, mas sao tambem 
produto dos graus de liberdade para os efeitos 
principals (qualquer metodo funciona): 

gl AxB = &4l —gl A — gift gl\xB = glf± X gift 

= 5- 1-2 =1x2 

= 2 =2 

10.2.5 A Soma dos Quadrados dos 
Resfduos (SS R ) © 

A soma dos quadrados dos resfduos e cal- 
culada da mesma maneira que para a ANOVA 
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de um fator (veja a Segao 8.2.6) e, novamente, 
representa diferengas individuals no desempe- 
nho ou a variancia que nao pode ser explicada 
pelos fatores que foram sistematicamente ma- 
nipulados. Vimos na ANOVA de um fator que 
o valor e obtido calculando o erro ao quadrado 
entre cada ponto de dados e a media correspon- 
dente do grupo. Uma forma alternativa para 
expressar isso foi como (veja a Segao 8.7): 

SSr Sgrupol Ah 1) “f ^grupo-^2 1)4" 

^grupo3(^3 1) + ' ’ ’ + ^grupon(^n 1) 

Assim, usamos as variancias individuals 
dentro de cada grupo e as multiplicamos pelo 
numero de pessoas dentro do grupo (n k ) me- 
nos um. Temos as variancias individuals de 
cada grupo na nossa tabela de dados original 
(Tabela 10.1) e ha oito pessoas em cada grupo 
(portanto, n k = 8); assim, a equagao fica: 

SSp Aroup I Oh 1) “f , ' l group20h 1) 

+ 4ou P 3(«3 - 1) + 4oup40h - 1) 
■'’groap.^Otg 1) “f AroupeOh 1) 

= (24,55)(8 - 1) + (106,7)(8 - 1) 

+ (42,86)(8 - 1) + (156,7)(8 - 1) 

+ (50)(8- 1) + (117,41)(8- 1) 

= (24,55 x 7) + (106,7 x 7) 

+ (42,86 x 7) + (156,7 x 7) 

+ (50 x 7)+ (117,41 x 7) 

= 171,85 + 746,9 + 300 + 1096,9 
+ 350+ 821,87 

= 3487,52 

Os graus de liberdade para cada grupo se- 
rao um a menos do que o numero de escores 
por grupo (isto e, 7). Portanto, se acrescentar- 
mos os graus de liberdade para cada grupo, 
temos um total de 6 x 7 = 42. 

10.2.6 As razoes F © 

Cada efeito na ANOVA de dois fatores (os 
dois efeitos principals e a interagao) tern sua 
propria razao F. Para calcular essas estatfsti- 
cas, primeiro temos que calcular os quadrados 
medios para cada efeito tomando a soma dos 
quadrados e dividindo-a pelos graus de liber¬ 


dade respectivos (volte a Segao 8.2.7). Tam- 
bem precisamos dos quadrados medios para 
o termo residual. Assim, para esse exemplo 
teremos quatro quadrados medios calculados 
da seguinte forma:: 


MSa = SS^ = 168 ! 75 =168 75 


1 


MS,; 


8h 


SS B 3332,292 


MS. 


J B 
gt B 

ss 


AxB 


2 

1978,125 


1666,146 
= 989,062 


MS r 


‘AxE 

SS C 3487,52 


JL 


42 


= 83,036 


A razao F para as duas variaveis indepen- 
dentes e sua interagao sao calculadas dividin- 
do seus quadrados medios pelos quadrados 
residuais medios. Novamente, se voce pensar 
na ANOVA de um fator, esse processo e exata- 
mente o mesmo! 


Fa 

F» 


ms a _ 

MS r 

ms b _ 

MS r 

-^^AxB 

ms r 


168,75 
83,036 
1666,146 
83,036 
_ 989,062 
” 83,036 


2,032 
= 20,065 
11,911 



Cada uma dessas razoes F 
pode ser comparada aos valo- 
res crfticos (com base nos seus 
graus de liberdade que podem 
ser diferentes para cada efeito) 
para nos dizer se ha uma probabilidade desses 
efeitos refletirem dados que surgiram por aca- 
so ou refletirem um efeito das nossas manipu- 
lagoes experimentais (esses valores crfticos 
podem ser encontrados no Apendice A.3). Se 
uma razao F observada exceder o valor crftico 
correspondente, ela e significativa. O SPSS ira 
calcular essas razoes F e a significancia exata 
para cada uma, mas espero ter mostrado para 
voce nesta segao que a ANOVA de dois fato¬ 
res e basicamente a mesma que a ANOVA de 
um fator exceto que a soma dos quadrados do 
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modelo e dividida em tres partes: o efeito de 
cada uma das variaveis independentes e o efei¬ 
to de como essas variaveis interagem. 

10.3 ANOVA FATORIAL UTILIZANDO 0 
SPSS© 

10.3.1 Entrando com dados e utilizando 
a janela principal de dialogos © 

Para entrar com esses dados no editor de 
dados do SPSS, lembre a regra basica: os niveis 
de uma variavel entre grupos sao colocados 
em uma unica coluna. Para aplicar essa regra 
a esses dados, precisamos criar duas variaveis 
codigo no editor de dados. Essas colunas irao 
representar o genero e o consumo de alcool. 
Assim, crie uma variavel denominada gender 
(genero) no editor de dados e ative a caixa de 
dialogo labels (rotulos). Voce deve definir o 
valor dos rotulos para representar os dois gene- 
ros. Nos temos muita experiencia com valores 
codificados, assim, voce deve estar muito feliz 
designando codigos numericos a diferentes gru¬ 
pos. Recomendo usar os codigos masculino = 0 
e feminino = 1. Uma vez feito isso, voce pode 
entrar com o valor de 0 ou 1 nessa coluna in- 
dicando o grupo a que a pessoa pertence. Crie 
uma segunda variavel denominada alcohol (al¬ 
cool) e designe codigos de grupo usando a caixa 
de dialogo labels (rotulos). Sugiro que voce co- 
difique essa variavel com os seguintes tres valo¬ 
res: placebo (sem alcool) =1,2 canecas = 2 e 
4 canecas = 3. Voce agora pode entrar com os 
valores 1, 2 ou 3 nessa coluna para representar 
a quantidade de alcool consumida pelo partici- 
pante. Lembre que se voce ativar opgao valores 
dos rotulos, vera texto no editor de dados em 
vez dos codigos numericos. Agora, a maneira 
como essa codificagao funciona e a seguinte: 

Uma vez que voce criou as duas variaveis 
codificadas, voce pode criar uma terceira va¬ 
riavel para colocar os valores da variavel de- 
pendente. Chame essa variavel attract (atra- 
gao) e use a opcao labels (rotulos) para dar 
a ela o nome completo de “attractiveness of 
date ” (atratividade do companheiro). Nesse 
exemplo existem duas variaveis independen- 


Genero Alcool O participante e 


0 

0 

0 

1 

1 

1 


1 Homem que nao consumiu 
alcool 

2 Homem que consumiu 
2 canecas 

3 Homem que consumiu 
4 canecas 

1 Mulher que nao consumiu 
alcool 

2 Mulher que consumiu 
2 canecas 

3 Mulher que consumiu 
4 canecas 


tes e diferentes participantes foram usados em 
cada condicao: portanto, podemos usar o pro- 
cedimento geral da ANOVA fatorial do SPSS. 
Esse procedimento foi projetado para analisar 
delineamentos fatoriais entre grupos. 

Para acessar a caixa de dialogo principal 
para a ANOVA fatorial geral, use o cami- 
nho do arquivo Analyze=>General Linear 
Model=>Univariate. .. (Analisar=>Modelo 
Linear Geral =>Univariado...). A caixa de dia¬ 
logo resultante e mostrada na Figura 10.1. Pri- 
meiro selecione a variavel dependente attract 
(atragao) da lista de variaveis no lado esquerdo 
da caixa de dialogo e a transfira para o espago 
denominado Dependent Variable (Variavel 
dependente) clicando em _d. No espago de¬ 
nominado Fixed Factor(s) (Fator(es) fixos), 
precisamos colocar qualquer variavel relevan- 
te para a analise. Selecione alcohol (alcool) 
e gender (genero) da lista de variaveis (essas 
variaveis podem ser selecionadas simultanea- 
mente clicando numa, pressionando o mouse 
e arrastando o ponteiro sobre a outra variavel) 
e transfira-as para a caixa Fixed Factor(s) 
(Fatores fixos) clicando em jJ. Existem ou- 
tros espagos que estao disponrveis para a rea- 
lizacao de analises mais complexas como a 
ANOVA de fatores aleatorios e a ANCOVA 
fatorial. A ANOVA de fatores aleatorios esta 
alem do escopo deste livro (leitores interes- 
sados devem consultar Jackson e Brashers, 
1994) e a ANCOVA fatorial simplesmente es- 
tende os principios descritos no Capftulo 9. 
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Figura 10.1 Caixa de dialogo principal para a ANOVA univariada. 


10.3.2 Modelos customizados © 

Por padrao, o SPSS conduz uma analise fa- 
torial completa (isto e, ela inclui todos os efeitos 
principals e interagoes de todas as variaveis in- 
dependentes especificadas na caixa de dialogo 
principal). Entretanto, voce pode querer custo- 
mizar o modelo utilizado a fim de testar algu- 
mas coisas. Para acessar a caixa de dialogo mo¬ 
del (modelo), clique em na caixa de 

dialogo principal (veja a Figura 10.2). Voce no- 


tara que, por definicao. o 
modelo fatorial completo 
esta selecionado. Mesmo 
com ele selecionado, 
existe a opgao na parte 
de baixo para mudar o tipo da soma dos quadra- 
dos utilizado na analise. Embora tenhamos 
aprendido sobre as somas dos quadrados e o que 
elas representam, nao discuti sobre as diferentes 
maneiras de calcula-las. Nao e necessario enten- 
der os calculos das diferentes formas das somas 




Figura 10.2 Modelos customizados na ANOVA. 
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dos quadrados, mas e importante que voce co- 
nhega os usos de alguns tipos diferentes. Por 
padrao, o SPSS usa as somas dos quadrados do 
Tipo III que tem a vantagem de permanecerem 
constantes independentemente das frequences 
das celulas. Assim, elas podem ser usadas tanto 
com delineamentos balanceados ou nao balan- 
ceados (isto e, diferentes numeros de participan- 
tes nos grupos), por isso elas sao a opgao pa¬ 
drao. As somas dos quadrados do Tipo IV sao 
como as do Tipo III, com a excegao de poderem 
ser usadas com dados nos quais valores estejam 
faltando (missing data). Desse modo, se voce 
tiver dados faltando no seu delineamento, deve 
utilizar a somas dos quadrados do Tipo IV. 

Para customizar um 
modelo, clique no clrculo 
denominado Custom 
(Customizar) para ativar a 
caixa de dialogo. As varia- 
veis especificadas na caixa 
de dialogo principal serao 
listadas no lado esquerdo e seguidas por uma 
letra em colchetes indicando o tipo da variavel 
(F = fator fixo, R = fator aleatorio, C = 
covariavel). Voce pode selecionar uma ou diver- 
sas variaveis dessa lista e transferi-las para o 
quadro denominado Model (Modelo) tanto 
como efeitos principais, como interagoes. Por 
defmigao, o SPSS transfere variaveis como ter- 
mos de interagao, mas existem muitas opgoes 
que nos permitem entrar com os efeitos princi¬ 
pais ou as interagoes de um, dois ou tres fatores. 
Essas opgoes evitam alguns problemas de ter 
que selecionar diversas combinagoes de varia¬ 
veis (porque, por exemplo, voce pode selecio¬ 
nar tres variaveis, transferi-las como interagSes 
de dois fatores e elas irao criar combinagoes de 
tres variaveis para voce). Embora a selegao do 
modelo tenha usos importantes (veja a Segao 
9.6), e provavel que voce queira executar a ana- 
lise fatorial completa na maioria das vezes. 

10.3.3 llustrando interagoes © 

Uma vez que as variaveis relevantes te- 
nham sido selecionadas, voce deve clicar em 
(tragar) para acessar uma caixa de dialogo 
semelhante a da Figura 10.3. A caixa de dialogo 


plots permite que voce selecione graficos de li- 
nhas para os seus dados e eles serao uteis para 
a interpretagao dos efeitos de interagao. Temos 
somente duas variaveis independentes, assim, 
existe somente um grafico que vale a pena ob- 
servar (o que mostra os nfveis de independen- 
cia de uma variavel contra a outra.). Selecione 
alcohol (alcool) da lista de variaveis do lado 
esquerdo da caixa de dialogo e transfira-a para 
o espago denominado Horizontal Axix (Eixo 
Horizontal) clicando em 3. No espago deno¬ 
minado Separate Lines (Linhas Separadas), 
precisamos colocar a variavel independente 
restante: gender (genero). Na verdade, inde¬ 
pendentemente da maneira como as variaveis 
sao apresentadas, voce deve usar o seu discer- 
nimento para produzir o grafico mais adequado 
ao interesse. Quando voce mudar as duas va¬ 
riaveis independentes para a caixa apropriada, 
clique em ** (adicionar) e esse grafico sera 
acrescentado a lista na parte de baixo da caixa 
de dialogo. Deveria estar claro que voce pode 
tragar uma grande variedade de graficos e, se 
voce tiver uma terceira variavel independente, 
tera uma opgao de tragar diferentes graficos para 
cada nfvel dessa terceira variavel. O diagrama 
selecionado nos auxiliara na interpretagao de 
qualquer interagao entre genero e consumo de 
alcool. Quando voce tiver terminado de espe- 
cificar os graficos, clique em CM " (continuar) 
para retornar a caixa de dialogo principal. 



Figura 10.3 Caixa de dialogo para tragar gra¬ 
ficos. 


Interaction 



Main effects 


All 2-way 


All 3-way 


All 4-way 

▼ 




























Descobrindo a Estatistica Usaimdo o SPSS 373 


10.3.4 Contrastes © 

Vimos no Capftulo 8 que e util comple- 
mentar a ANOVA com contrastes que dividam 
os efeitos principals e nos digam onde estao as 
diferengas entre grupos. Para a ANOVA de um 
fator independente, o SPSS tern um procedi- 
mento para a entrada de codigos que definam 
os contrastes que queremos fazer. Entretanto, 
para a ANOVA de dois fatores nao existe essa 
facilidade e, em vez disso, estamos restritos a 
fazer um de muitos contrastes padrao. Esses 
contrastes padrao estao descritos na Tabela 8.6. 
Para ser honesto, esses contrastes irao fornece- 
rao o que voce quer em muitas situagoes dife- 
rentes, mas se eles nao fornecerem, e voce qui- 
ser definir seus proprios contrastes, isso devera 
ser feito utilizando a sintaxe. Determinar con¬ 
trastes com a sintaxe nao sera, provavelmente, 
muito interessante para a maioria das pessoas, 
portanto nao os incluf aqui; entretanto, porque 
sempre me perguntam muito sobre isso, e eu 
sou um completo masoquista, preparei um guia 
bem detalhado de como fazer isso no arquivo 
ContrastsUsingSyntax.pdf que esta no site 
www.artmed.com.br. Assim, se voce quiser sa¬ 
ber mais, de uma olhada nesse material. 

Voltando ao assunto, podemos utilizar os 
contrastes padrao nesse exemplo. O efeito do 
genero tern somente dois nfveis e, assim, nao 
precisamos de contrastes para o efeito prin¬ 
cipal. O efeito do alcool tem tres nfveis: sem 
alcool, 2 canecas e 4 canecas. Poderfamos, 
novamente, selecionar um contraste simples 
para essa variavel e usar a primeira categoria 
como uma referenda. Isso compararia o gru- 
po de 2 canecas ao grupo sem alcool e, entao, 
compararia a categoria de 4 canecas ao grupo 
sem alcool. Desse modo, os grupos com al¬ 
cool seriam comparados ao grupo sem alcool. 
Podemos, tambem, selecionar um contraste 
repetido. Isso compararia o grupo de 2 cane¬ 
cas ao grupo sem alcool e, entao, o grupo de 
4 canecas ao grupo de 2 canecas (assim, ele 
se move entre os grupos comparando cada 
grupo ao anterior). Isso pode ser util. Pode- 
rfamos, tambem, fazer um contraste Helmert, 
o qual compara cada categoria contra todas as 
categorias subsequentes, nesse caso, compara¬ 


ria o grupo sem alcool as categorias restantes 
(isto e, todos os grupos que beberam alcool) 
e, entao, moveria a categoria de 2 canecas e 
a compararia a categoria de 4 canecas. Qual- 
quer uma dessas comparacoes seria boa, mas 
elas somente nos dao contrastes para os efei¬ 
tos principais. Na realidade, na maior parte do 
tempo, realmente queremos contrastes para 
o nosso termo de interagao e eles podem ser 
obtidos somente por meio da sintaxe (bem, 
parece que voce tera que consultar o arquivo 
sugerido no final das contas!) 

Para conseguir contrastes para o efeito 
principal do alcool, clique em (contras¬ 
tes) na caixa de dialogo principal. Usamos a 
caixa de dialogo contrasts (contrastes) an¬ 
tes, na Segao 9.3.3, assim, volte aquela segao 
para auxilia-lo a selecionar um contraste Hel¬ 
mert para a variavel alcool. Uma vez que os 
contrastes tenham sido selecionados (Figura 
10.4), clique em ■=«*'- (continuar) para retor- 
nar a caixa de dialogo principal. 

10.3.5 Testes post hoc ® 

Os testes post hoc sao obtidos clicando 
em poMtiot na caixa de dialogo principal para 
acessar a caixa de dialogo testes post hoc (Fi¬ 
gura 10.5). A variavel gender (genero) tem 
somente dois nfveis, assim, nao precisamos 
selecionar os testes post hoc para aquela va¬ 
riavel (porque qualquer efeito significativo 
pode somente refletir diferengas entre homens 
e mulheres). Entretanto, havia tres nfveis da 
variavel alcool (sem alcool, 2 canecas e 4 ca- 



Figura 10.4 Caixa de dialogo para a obter con¬ 
trastes padronizados. 
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Figura 10.5 Caixa de dialogo para os testes posf hoc. 


necas): portanto, e necessario conduzir os tes¬ 
tes post hoc. Primeiro voce deve selecionar a 
variavel alcohol (alcool) da caixa denomina- 
da Factors (Fatores) transferi-la para a caixa 
denominada Post hoc Tests (Testes post hoc). 
Minhas recomendacoes sobre quais testes post 
hoc usar estao na Segao 8.2.11 (nao quero me 
repetir). E suficiente dizer que voce deve se¬ 


lecionar aqueles que foram selecionados na 
Figura 10.5! Clique em para retornar a 
caixa de dialogo principal. 

10.3.6 Opgoes© 

Clique em at>l ' on * (OpLjoes) para ativar a 
caixa de dialogo semelhante a da Figura 10.6. 



Figura 10.6 Caixa de dialogo Options (Opgoes). 
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As opcoes para a ANOVA fatorial sao bem 
simples. Inicialmente, voce pode solicitar al- 
gumas estatfsticas descritivas que serao apre- 
sentadas em uma tabela contendo as medias, 
desvios padrao, erros padrao, amplitudes e in- 
tervalos de confianga para as medias de cada 
grupo. Essa e uma opcao util porque ela ajuda 
a interpretar os resultados finais. Uma opgao 
vital a ser selecionada e o teste de homoge- 
neidade das variancias. Assim como no teste 
t, existe a hipotese de que as variancias dos 
grupos sao iguais e, selecionando essa opgao, 
testamos se a hipotese e satisfeita. O SPSS usa 
o teste de Levene para testar a hipotese que as 
variancias dos grupos sao iguais. Uma vez se- 
lecionadas essas opcoes, clique em para 
retornar a caixa de dialogo principal e clique 
em para executar a analise. 

10.4 SAIDAS DA ANOVA FATORIAL © 

10.4.1 Saidas para as analises 
preliminares © 

A Saida do SPSS 10.1 mostra a saida 
inicial da ANOVA fatorial. Essa tabela de 
estatfsticas descritivas foi produzida porque 
marcamos a opgao Descriptive statistics (Es- 
tatisticas descritivas) na caixa de dialogo op¬ 
tions (opcoes) (veja a Figura 10.6), e ela mos¬ 
tra as medias, desvios padrao e o numero de 
participantes em todas as condigoes do experi- 


mento. Assim, por exemplo, podemos ver que 
na condicao placebo os homens cantaram uma 
mulher que foi avaliada em 67% na escala de 
atragao enquanto as mulheres selecionaram 
homens avaliados em 61% nessa mesma es¬ 
cala. Essas medias serao uteis na interpretagao 
de qualquer efeito que surja na analise. 

10.4.2 0 teste de Levene © 

A Saida do SPSS 10.2 mostra os resulta¬ 
dos do teste de Levene. Abordamos o teste de 
Levene na Segao 3.6 e inumeras vezes depois! 
Em resumo, o teste de Levene e usado para 
avaliar a viabilidade da hipotese da igualda- 
de das variancias (homogeneidade da varian- 
cia). O teste de Levene verifica se ha alguma 
diferenga significativa entre as variancias do 

Saida do SPSS 10.2 


Levene's Test of Equality of Error 
Vacancies 3 (Teste de Levene para a 
Igualdade das Variancias dos Erros) 



F 

dfl 

(gii) 

df2 

(gi2) 

Sig. 

Attractiveness of 
Date (Atratividade 
do Companheiro) 

1.527 

5 

42 

0.202 


Testa a hipotese nula de que a variancia dos erros da va- 
riavel dependente e igual em todos os grupos. 
a Delineamento: Intercepto + alcool + Genero +Alcool. 
* Genero 


Saida do SPSS 10.1 


Descriptive Statistics (Estatisticas Descritivas) 



Alchool Consumption 
(Consumo de Alcool) 

Gender (Genero) 

Mean 

(Media) 

Std. Deviation 
(Desvio padrao) 

N 

Attractiveness of 

Placebo 

Male (Masculino) 

66.8750 

10.3294 

8 

Date (Atratividade 


Female (Feminino)) 

60.6250 

4.9552 

8 

do Companheiro) 


Total (Total) 

63.7500 

8.4656 

16 


2 Pints 

Male (Masculino) 

66.8750 

12.5178 

8 



Female (Feminino)) 

62.5000 

6.5465 

8 



Total (Total) 

64.6875 

9.9111 

16 


4 Pints 

Male (Masculino) 

35.6250 

10.8356 

8 



Female (Feminino)) 

57.5000 

7.0711 

8 



Total (Total) 

46.5625 

14.3433 

16 


Total 

Male (Masculino) 

56.4583 

18.5026 

24 



Female (Feminino)) 

60.2083 

6.3381 

24 



Total (Total) 

58.3333 

13.8123 

48 
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grupo e, assim, um resultado nao-significativo 
(como encontrado aqui) e um indicativo de que 
a hipotese foi satisfeita. Se o teste de Levene 
e significative, algumas providencias devern 
ser tomadas para equalizar as variancias pela 
transformagao dos dados (tirar a raiz quadra- 
da de todos os valores da variavel dependente 
pode algumas vezes atingir esse objetivo - veja 
o Capftulo 3 e Howell, 2002, p.347) 

10.4.3 A tabela principal da ANOVA © 

A Saida do SPSS 10.3 e a parte mais im- 
portante da safda porque ela nos diz se qual- 
quer uma das variaveis independentes teve um 
efeito na variavel dependente. E importante 
observar os valores da significancia das varia¬ 
veis independentes na tabela. A primeira coisa 
a ser notada e que existe um efeito significati¬ 
ve do alcool (porque o valor de significancia 
e menor do que 0,05). A razao F e altamente 
significativa, indicando que a quantidade de 
alcool consumida afetou significativamente 
quem o participante tentou cantar. Isso sig- 
nifica que, no geral, quando ignoramos se o 
participante era homem ou mulher, a quanti¬ 
dade de alcool influenciou na selegao do seu 
companheiro. O efeito da variavel tomada 
isoladamente e conhecido como efeito princi¬ 
pal. A melhor maneira para se ver o que isso 
significa e observar um diagrama de barras 
da atragao media em cada nfvel de alcool (ig¬ 
nore completamente o genero). Esse grafico 


pode ser tracado usando as medias na safda 
do SPSS 10.1 (viu. eu disse que esses valores 
seriam de alguma utilidade!) e a opcao Bar... 
(Barra) do menu Graphs (Graficos). 

A Figura 10.7 mostra claramente que, 
quando voce ignora o genero, a atratividade 
geral do parceiro selecionado e semelhante 
as situagSes em que nao foi bebido alcool e 
quando 2 canecas foram bebidas (as medias 
desses grupos sao aproximadamente iguais). 
Portanto, esse efeito principal significativo e 
provavel que reflita na queda na atratividade 
dos parceiros selecionados quando 4 canecas 
foram bebidas. Essa descoberta parece indicar 
que a pessoa esta disposta a aceitar um com¬ 
panheiro menos atrativo depois de 4 canecas. 

A proxima parte da safda 10.3 do SPSS 
nos informa sobre o efeito principal do gene¬ 
ro. Dessa vez a razao F nao e significativa (p 
= 0,161, o que e maior do que 0,05). O que 
esse efeito significa e que, no geral, quando 
ignoramos quanto alcool foi bebido, o genero 
do participante nao influenciou a atratividade 
do parceiro que o participante selecionou. Em 
outras palavras, outras coisas sendo iguais, 
homens e mulheres igualmente seleciona- 
ram acompanhantes atraentes. Construir um 
diagrama de barras da atratividade media 
dos acompanhantes para homens e mulhe¬ 
res (ignorando quanto alcool foi consumido) 
revela o significado desse efeito principal. A 
Figura 10.8 mostra que a atratividade media 


Saida 10.3 do SPSS 

Tests of Between-Subjects Effects (Testes de efeitos entre participantes) 


Dependent VariableAttractiveness of Date (Variavel dependente: Atratividade do companheiro) 


Source (Fonte) 

Type III Sum of 
Squares (Soma dos 
quadrados do tipo III) 

£If 
(gi) 

Mean Square 
(Media ao 
quadrado) 

F 

Sig. 

Corrected Model (Modelo Corrigido) 

5479.167 a 

5 

1095.833 

13.197 

0.000 

Intercept (Intercepto) 

163333.333 

1 

163333.333 

1967.025 

0.000 

ALCOHOL (Alcool) 

3332.292 

2 

1666.146 

20.065 

0.000 

GENDER (Genero) 

168.750 

1 

168.750 

2.032 

0.161 

GENDER*ALCOHOL (Genero*Alcool) 

1978.125 

2 

989.062 

11.911 

0.000 

Error [Eno) 

3487.500 

42 

83.036 



Total (Total) 

172300.000 

48 




Corrected Total (Total corrigido) 

8966.667 

47 





a. R ao quadrado = 0,611 (R ao quadrado ajustado = 0,565). 
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Diagrama de barra de erros mostrando urn 1C de 95% para a media 



dos companheiros dos participantes homens 
e mulheres foi muito parecida (as medias sao 
diferentes por somente 4%). Portanto, esse 
efeito nao-significativo reflete o fato de que 
a atratividade media foi similar. Podemos 
concluir disso que, ceretis paribus*, homens 
e mulheres escolhem igualmente companhei¬ 
ros atrativos. 

Finalmente, a Saida 10.3 do SPSS nos in¬ 
forma sobre a interacao entre o efeito do gene¬ 
ra e o efeito do alcool. O valor de F e altamen- 
te significativo (porque o valor de p e menor 
do que 0,05). O que isso realmente significa 
e que o efeito do alcool na selecao de parcei- 
ros foi diferente para participantes homens do 
que para mulheres. A saida do SPSS inclui um 
grafico que solicitamos (veja a Figura 10.3), 
que nos diz algo sobre a natureza desse efeito 
de interacao (veja a Figura 10.9). 


A Figura 10.9 mos- 
tra claramente que para 
as mulheres o alcool 
tern pouco efeito: a atra¬ 
tividade do parceiro se- 
lecionado e estavel nas 
tres condigdes (como 
esta mostrado pela li- 
nha quase horizontal). 

Entretanto, para os homens, a atratividade de 
suas parceiras e estavel somente quando uma 
pequena quantia foi ingerida, mas rapidamente 
declina quando bebem mais. As linhas nao-pa- 
ralelas normalmente indicam um efeito de in- 
tera^ao significativa. Nesse grafico em particu¬ 
lar as linhas realmente se cruzam, o que indica 
uma grande interacao entre as variaveis inde- 
pendentes. A interacao nos diz que o alcool 
tem pouco efeito na selecao do acompanhante 
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Diagrama de barra de erros mostrando urn 1C de 95% para a media 



Figura 10.8 Grafico para mostrar o efeito do genera na selegao do companheiro. 


ate que 4 canecas tenham sido bebidos e que o 
efeito do alcool e predominante somente nos 
participantes masculinos. Resumindo, os re- 
sultados mostram que as mulheres mantem seu 
alto padrao na selegao de seus companheiros 
apesar do alcool enquanto os homens, quando 
bebem algumas cervejas, tentam pegar qual- 
quer coisa que ande! Um ponto interessante 
demonstrado por esses dados e que conclufmos 
antes que o alcool significativamente afetava 
a atratividade do acompanhante na selegao (o 
efeito principal alcool); entretanto, o efeito de 
interagao nos diz que isso somente e verdade 
com homens (as mulheres parecem nao se- 
rem afetadas). Isso demonstra como os efeitos 
principals podem ser enganosos: geralmente as 
interagoes entre as variaveis sao mais interes- 
santes num delineamento fatorial. 


* N. de T.: Mantendo tudo o mais constante, isto e, se- 
melhante. 


10.4.4 Contrastes © 

A Saida 10.4 do SPSS mostra os resulta- 
dos do nosso contraste Helmert no efeito do 
alcool. Isso nos ajuda a analisar o efeito do 
alcool. O topo da tabela mostra o contraste 
para Level 1 vs. Later (Nivel 1 vs. Outros) o 
que nesse caso significa o grupo sem alcool 
comparado aos dois grupos com alcool. Isso 
testa se a media do grupo sem alcool (63,75) 
e diferente dos grupos dois 2 canecas e 4 
canecas combinados (64,69 + 46,56)/2 = 
55,625). Isso e uma diferenga de 8,125 (63,75 
- 55,63) mostrada por ambas as Estimativa 
de Contraste e a Diferenga na tabela. O im- 
portante a ser verificado e o valor de Sig. que 
nos diz se a diferenga e significativa. Ela e 
porque o Sig. e 0,006, o que e menor do que 
0,05. Ja foi apresentado o intervalo de con- 
fianga para essa diferenga e, porque ele nao 
passa pelo zero, podemos afirmar que essa 
amostra e uma das 95 em 100 que produz 
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Nenhum 2 Canecas 4 Canecas 

Consumo de alcool 

Figura 10.9 Grafico da interagao entre genero e o consumo de alcool na selegao do compa- 
nheiro. 


Saida do SPSS 10.4 

Contrast Results (K Matrix) (Resultados dos Contrastes - Matriz K) 


Alcohol consumption 
(Consumo de alcool) 

Helmert Contrast 
(Contraste de Helmert) 

Dependent Variable 
(Variavel dependente) 

Attractiveness of 

Date (Atratividade 
do companheiro) 

Level 1 vs. Later (Nivel 

Contrast Estimate (Estimativa do Contraste) 

8.125 

1 vs. Outros) 

Hypothesized Value (Valor Hipotetico) 


0 


Diference (Estimate - Hypothesized) (Diferenga (Estimati- 

8.125 


va - Hipotetico) 




Std. Error (Erro Padrao) 


2.790 


Sig (Sig.) 


0.006 


95% Confidente Interval For Differen- 

Lower Bound 

2.494 


ce (Intervalo de Confianga de 95% Para 

(Limite Inferior) 



a Diferenga) 

Upper Bound 

13.756 



(Limite Superior) 


Level 2 vs. Level 3 

Contrast Estimate (Estimativa do Contraste) 

18.125 

(Nivel 2 vs. Nivel 3) 

Hypothesized Value (Valor Hipotetico) 


0 


Diference (Estimate - Hypothesized) (Diferenga (Estimati- 

18.125 


va - Hipotetico) 




Std. Error (Erro Padrao) 


3.222 


Sig (Sig.) 


0.000 


95% Confidente Interval For Differen- 

Lower Bound 

11.623 


ce (Intervalo de Confianga de 95% Para 

Limite Inferior) 



a Diferenga) 

Upper Bound Li- 

24.627 



mite Superior) 
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um intervalo de confianga contendo o valor 
real da diferenga, portanto, a diferenga real 
e maior do que zero (entre 2,49 e 13,76, para 
ser preciso). Assim, podemos concluir que o 
efeito do alcool e que qualquer quantidade 
reduz a atratividade do parceiro selecionado 
comparado com quando a bebida nao e in- 
gerida. E claro que isso e enganoso porque, 
na verdade, as medias para os grupos sem al¬ 
cool e 2 canecas sao muito parecidas (63,75 e 
64,69), assim, 2 canecas de alcool nao reduz 
a atratividade dos parceiros selecionados! A 
comparagao e significativa porque ela esta 
testando o efeito combinado de 2 e 4 canecas, 
e como 4 canecas tern um efeito muito for¬ 
te, ele puxa a media para baixo. Isso mostra 
por que voce deve ser cauteloso sobre como 
interpretar esses contrastes: voce precisa ob- 
servar os contrastes restantes tambem. 

A parte de baixo da tabela mostra o con- 
traste para Level 2 vs. Level 3 (Nivel 2 vs. Ni¬ 
vel 3), o que nesse caso significa o grupo de 
2 canecas comparado ao grupo dos 4 canecas. 
Isso testa se a media do grupo de 2 canecas 


(64,69) e diferente da media combinada do 
grupo de 4 canecas (46,56). Isso e uma dife- 
renga de 18,13 (64,69 - 46,56) mostrada por 
ambas Estimativa de Contraste e Diferenga na 
tabela. Novamente, o importante a observar e 
o valor de Sig. que nos mostra se a diferenga e 
significativa. Ela e porque o Sig. e 0,000, o que 
e menor do que 0,5. Tambem e mostrado o in¬ 
tervalo de confianga para essa diferenga e, por 
ela nao conter zero, podemos estar certos que 
esse intervalo de confianga contera o verda- 
deiro valor da diferenga com 95% de precisao, 
entao a verdadeira diferenga e maior do que 
zero (entre 11,62 e 24,63, para ser preciso). 
Isso nos mostra que tomar 4 canecas reduziu 
de modo significativo a atratividade nos par¬ 
ceiros selecionados do que com 2 canecas. 

10.4.5 Analise post hoc © 

Os testes post hoc (Saida 10.5 do SPSS) 
analisam o efeito principal do alcool e podem 
ser interpretados como se uma ANOVA de um 
fator independente tivesse sido conduzida na 


r ;- 

Dica da Samanta Ferrinho 





V. 


• A ANOVA de dois fatores independentes compara varias medias quando exis- 
tem duas variaveis independentes e participantes diferentes foram utilizados 
em todas as condigoes experimentais; por exemplo, se quisermos saber se 
diferentes metodos de ensino funcionam melhor para materias diferentes. 
Podemos selecionar estudantes de quatro cursos (Psicologia, Geografia, Ad- 
ministragao e Estatistica) e designa-los a um ensino baseado em aulas expo- 
sitivas ou leituras de livros. 

• As duas variaveis sao curso e metodo de ensino. A saida pode ser as notas do 
final do curso (como uma percentagem). 

• Teste para homogeneidade da variancia usando o teste de Levene. Encontre a 
tabela com esse rotulo: se o valor na coluna denominada Sig. e menor do que 
0,05, a hipotese foi violada. 

• Na tabela denominada Testes dos Efeitos Entre Sujeitos, observe a coluna de¬ 
nominada Sig. para todos os tres efeitos: deve existir um efeito principal para 
cada variavel e um efeito da interagao entre duas variaveis; se o valor for menor 
do que 0,05, o efeito e significativo. Para efeitos principals, consulte os testes 
post hoc para ver quais os grupos diferem, e para a interagao, examine um gra- 
fico de interagao ou conduza uma analise de efeitos simples. (Quadro 10.2). 

• Para os testes post hoc, novamente, observe a coluna denominada Sig. a fim 
de descobrir se suas comparagoes sao significativas (elas serao se o valor de 
significance for menor do que 0,05). 

• Teste as mesmas hipoteses para a ANOVA. 
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Saida 10.5 do SPSS 


Multiple Comparisons (Comparacoes Multiplas) 


Dependent Variable: Attractiveness of Date (Variavel dependente: Atratividade do parceiro) 


(!) Alcohol (J) Alcohol 

Consumption Consumption 
(Consumo (Consumo 

de Alcool) de Alcool) 

Mean 

Difference 

(l-J) 

(Diferenga 

Media) 

Std. 

Error 

(Erro 

Padrao) 

Sig. 

95% Confidence Interval 
(Intervalo de 95% de confianga) 

Lower Bound 
(Limite inferior) 

Upper 

Bound (Limite 
Superior) 

Bonferroni None (Sem) 2 pints 

4 pints 

-0.9375 

17.1875* 

3.22172 

3.22172 

1.000 

0.000 

-8.9714 

9.1536 

7.0964 

25.2214 

2 pints None (Sem) 

4 pints 

0.9375 

18.1250* 

3.22172 

3.22172 

1.000 

0.000 

-7.0964 

10.0911 

8.9714 

26.1589 

A pints None (Sem) 

2 pints 

-17.1875* 

-18.1250* 

3.22172 

3.22172 

0.000 

0.000 

-25.2214 

-26.1589 

-9.1536 

-10.0911 

Games- None (Sem) 2 pints 

Howell 4 pints 

-0.9375 

17.1875* 

3.25860 

4.16380 

0.955 

0.001 

-8.9809 

6.7981 

7.1059 

27.5769 

2 pints None (Sem) 

4 pints 

0.9375 

18.1250* 

3.25860 

4.35860 

0.955 

0.001 

-7.1059 

7.3104 

8.9809 

28.9396 

A pints None (Sem) 

2 pints 

-17.1875* 

-18.1250* 

4.16380 

4.35860 

0.001 

0.001 

-27.5769 

-28.9396 

-6.7981 

-7.3104 


Com base nas medias observadas. 

* A diferenga media e significativa ao nfvel de 0,05. 
Obs: Pint = Caneca 


Attractiveness of Date (Atratividade do Parceiro) 


Alcohol Consumption 
(Consumo de Alcool) 

N 

Subset (Subconjnto) 

7 

2 

Ryan-Einot-Gabriel-Welsch Range 8 

4 pints 

16 

46.5625 


(Amplitude de Ryan-Einot-Gabriel- 

None (Sem) 

16 


63.7500 

Welsch) 

2 pints 

16 


64.6875 


Sig. 


1.000 

0.772 


Medias para os grupos em subconjuntos homogeneos sao mostradas. 
Com base nas somas dos quadrados do Tipo ill. 

0 termo erro e a media dos quadrados (Erro) = 83,036. 
a. Alfa = 0,05. 


variavel alcool (isto e, os efeitos relatados para 
o alcool despencaram com respeito ao genero). 
Os testes Bonferroni e Games-Howell mostram 
o mesmo padrao de resultados: quando os par- 
ticipantes nao beberam alcool ou 2 canecas de 
alcool eles selecionaram, igualmente, parceiros 
atraentes. Entretanto, depois de consumirem 4 
canecas os participantes selecionaram signifi- 
cativamente parceiros menos atraentes do que 
apos 2 canecas (p < 0,001) e sem alcool (p < 
0,001). E interessante notar que as medias da 
atratividade do parceiro apos sem alcool e 2 ca¬ 


necas foram tao semelhantes que a probabilida- 
de da diferenga obtida entre aquelas medias e 1 
(isto e, completamente provavel!) O teste RE- 
GWQ confirma que as medias das condigoes 
placebo e 2 canecas foram iguais enquanto que 
a media do grapo de 4 canecas foi diferente. 
Deve ser notado que esses testes post hoc igno- 
ram o efeito interativo de genero e alcool. 

Em resumo, devemos concluir que o al¬ 
cool tem um efeito na atratividade dos par¬ 
ceiros selecionados. No geral, apos uma dose 
relativamente pequena de alcool (2 canecas) 
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Quadro 10.2 


Analise dos efeitos simples (D 



Uma maneira popular de analisar um termo de interagao e utilizar uma tec- 
nica chamada de analise dos efeitos simples. Essa analise basicamente observa 
os efeitos de uma variavel independente em nlveis individuals da outra variavel 
independente. Assim, por exemplo, nos dados do efeito alcool (voce e que be- 
beu pouco), pudemos fazer uma analise dos efeitos simples observando o efeito 
do genero em cada nivel de alcool. Isso significaria pegar a media da atrativida- 
de da companhia selecionada pelos homens e compara-la com aquela para as mulheres apos o 
placebo e, entao, fazer a mesma comparagao para 2 canecas e, finalmente, para 4 canecas. Outra 
maneira de analisar isso e comparar cada triangulo ao circulo correspondente na Figura 10.9: 
baseados no grafico nao encontramos diferenga entre os grupos sem alcool e 2 canecas (em 
ambos os casos o triangulo e o circulo estao localizados quase na mesma posigao), mas pode- 
mos encontrar uma diferenga apos 4 canecas (porque o circulo e o triangulo estao bem separa- 
dos). A alternativa seria comparar a media da atratividade apos o placebo, 2 canecas e 4 canecas 
para os homens e, entao, uma analise separada para as mulheres. (Isso seria um pouco parecido 
como fazer a ANOVA de um fator independente no efeito do alcool em homens e, entao, fazer 
uma ANOVA de um fator independente diferente para o efeito do alcool nas mulheres). Voce nao 
precisa ver como esses efeitos simples sao calculados (embora, se voce estiver interessado, esta 
explicado no Apendice A.6 ou no arquivo Calculating SimpleEffects.pdf no site www.artmed. 
com.br), mas e util saber como faze-los no SPSS. Infelizmente, eles nao podem ser feitos pela 
caixa de dialogo e, em vez disso, voce deve usar a sintaxe do SPSS (veja a Segao 2.6 para lem- 
brar sobre a janela da sintaxe). A sintaxe que voce precisa usar nesse exemplo e: 


MANOVA 

attract BY gender (0 1) alcohol (1 3) 


* Isso inicia a ANOVA especificando a saida ou a variavel dependente attract (atragao) e o 
comando BY e seguido pelas nossas variaveis independentes gender e alcohol (genero e alcool) 
- os numeros nos parenteses sao os codigos minimos e maximos dos grupos usados para defi- 
nir essas variaveis. 


/DESIGN = gender WITHIN alcohol (1) gender WITHIN alcohol (2) gender WITHIN alcohol (3) 

* Isso especifica os efeitos simples. Por exemplo, "gender WITHIN alcohol (1)" solicits ao 
SPSS a analise do efeito do genero no nivel 1 de alcool (isto e, quando o alcool nao foi usado). 0 
numero nos parenteses deve se relacionar ao nivel da variavel que voce quer observar (sendo o 
nivel 1 o que tern o codigo mais baixo no editor de dados). Se quisermos comparar o alcool nos 
niveis do genero, escrevemos isso ao contrario: 

/DESIGN = alcohol WITHIN gender (1) alcohol WITHIN gender (2) 

/PRINT 

CELLINFO 

SIGNIF (UNIV MULT AVERF HF GG). 

* Essas linhas finais apenas solicitam algumas descritivas para cada celula da analise (CELLIN¬ 
FO) e para imprimir a ANOVA principal (SIGNIF). A sintaxe para observar o efeito do genero nos 
diferentes niveis de alcool esta no arquivo denominado GogglesSimpleEffescts.sps. Abra esse 
arquivo (verifique se voce tern o goggles.sav carregado no editor de dados) e execute a sintaxe. 
A saida que voce consegue sera na forma de texto (melhor do que tabelas). Parte do texto ira 
repetir os resultados da ANOVA principal da saida do SPSS 10.3. Os efeitos simples sao apresen- 
tados da seguinte maneira: 


(i Continua) 
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Quadro 10.2 (Continuagao) 


[Analise da Variancia 


***** Analysis of Variance - design 1 * * * 

- delineamento 1] 

Tests of Significance for ATTRACT using UNIQUE sums of squares [Testes de 
significancia para ATTRACT usando a soma dos quadrados UNIQUE] 

Source of Variation 


[Fonte 

da variagao] 


ss 

DF 

MS 

F 

Sig 

of F 

WITHIN 

+ RESIDUAL 


6819, 

, 79 

44 

155,00 




GENDER 

WITHIN ALCOHOL 

(i) 

156, 

,25 

1 

156,25 

1,01 

0 , 

321 

GENDER 

WITHIN ALCOHOL 

(2) 

76, 

, 56 

1 

76,56 

0,49 

0 , 

486 

GENDER 

WITHIN ALCOHOL 

(3) 

1914, 

, 06 

1 

1914,06 

12,35 

0 , 

001 

(Model) 

[Modelo] 


2146, 

, 87 

3 

715,62 

4,62 

0 , 

007 

(Total) 



8966, 

, 67 

47 

190,78 





R-Squared (R 2 ) = [R Quadrado] 0,239 

Adjusted R-Squared [R 2 ajustado] 0,188 

Observando os valores de significance para cada efeito simples, parece que nao houve dife- 
renga significativa entre homens e mulheres no nivel 1 do alcool (isto e, sem alcool) ou no nivel 2 
do alcool (2 canecas). No entanto, houve uma diferenga bem significativa no nivel 3 do alcool (o 
que, julgando pelo grafico, mostra que a media para os homens e consideravelmente mais baixa 
do que para as mulheres). 

Outra coisa interessante para acompanhar os efeitos de interagao e executar os contrastes 
para os termos de interagao. Infelizmente, isso pode ser feito somente usando a 
sintaxe e e um processo muito envolvente, assim, se voce acha que deve fazer 
isso, olhe no arquivo ContrastsUsingSYntax.pdf no site www.artmed.com.br: 
preparei esse arquivo especialmente para apresentar um exemplo para especi- 
ficar contrastes por meio de interagoes. 



os humanos continuam com controle dos 
seus julgamentos e os nfveis de atratividade 
dos companheiros escolhidos sao consisten- 
tes com o grupo-controle (sem o consumo de 
alcool). Entretanto, apos uma dose maior de 
alcool, a atratividade das companhias escolhi- 
das diminui significativamente. Esse efeito e 
chamado de efeito alcool (“efeito voce e que 
bebeu pouco”). A interagao tambem mostra 
uma diferenga de genera no efeito alcool. Pa¬ 
rece que os homens tern mais probabilidade 
de escolher uma companheira menos atrativa 
quando bebem. As mulheres, em comparacao, 
conseguem manter seus padroes apesar de es- 
tarem bebadas. O que nos ainda nao sabemos 
e se as mulheres se tornarao mais suscetrveis 
ao efeito alcool com o aumento da dose. 


10.5 INTERPRETANDO GRAFIC0S DE 
INTERAQOES © 

Ja observamos um grafico de interagao 
quando interpretamos a analise neste capftulo. 
Entretanto, as interagoes sao muito importan- 
tes e a chave para o entendimento delas e ser 
capaz de interpretar os grdficos de interagao. 
No exemplo deste capftulo, usamos a Figura 
10.9 para concluir que a interagao provavel- 
mente refletiu o fato de que homens e mu¬ 
lheres escolhem, igualmente, companheiros 
atraentes quando nao ingeriram alcool e apos 
2 canecas, mas com 4 canecas os padroes dos 
homens caem de forma significativa enquanto 
o das mulheres se mantem. Imagine que temos 
o perfil dos resultados apresentado na Figura 
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10.10; voce acha que ainda teriamos um efeito 
de interagao significativo? 

O perfil desses dados provavelmente pro- 
duziria um termo de interagao significativo por- 
que embora a atratividade dos acompanhantes 
dos homens e mulheres seja semelhante antes 
da ingestao de alcool e apos a ingestao de 2 ca- 
necas de alcool, existe uma grande diferenga 
apos 4 canecas. Isso reflete um cenario onde o 
efeito alcool e igualmente grande em homens e 
mulheres apos 4 canecas (e nao existe sem al¬ 
cool), mas age mais rapidamente nos homens: a 
atratividade das suas companhias despenca apos 
2 canecas enquanto as mulheres mantem seus 
padroes ate 4 canecas (nesse ponto eles sairiam 
com qualquer uma - ate mesmo com uma ma- 
caca). Vamos tentar outro exemplo. Existe uma 
intera 9 ao significativa na Figura 10.11 ? 

Para os dados na Figura 10.11, e impro- 
vavel que exista uma interagao significativa 
porque o efeito do alcool e o mesmo para os 
homens e mulheres. Assim, para homens e mu¬ 
lheres a atratividade dos seus companheiros 
antes da ingestao de alcool e muito alta, mas 


apos 2 canecas eles reduzem de quantidade se¬ 
melhante (a inclina^ao das linhas dos homens e 
mulheres e quase a mesma). Apos 4 canecas ha 
uma queda adicional e, novamente, essa queda 
e quase a mesma em homens e mulheres (as li¬ 
nhas, novamente, se inclinam quase no mesmo 
angulo). O fato de que a linha para os homens 
e mais baixa do que aquela para as mulheres 
apenas reflete o fato de que, por todas as con- 
di^oes, os homens tem padrSes mais baixos do 
que as mulheres: isso reflete um efeito princi¬ 
pal de genero (isto e, os homens geralmente es- 
colhem companheiras menos atraentes do que 
as mulheres em todos os niveis de alcool). Dois 
pontos gerais que podemos concluir disso sao: 

• As interagoes significativas sao mostra- 
das acima por linhas nao-paralelas num 
grafico de interacao. Entretanto, isso nao 
quer dizer que linhas nao-paralelas auto- 
maticamente significam que a interagao e 
significativa: a interacao ser ou nao sig¬ 
nificativa ira depender do grau em que as 
linhas nao sao paralelas! 



Figura 10.10 Outro grafico da interagao. 
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Figura 



• Se as linhas num grafico de interagao se 
cruzam, obviamente elas nao sao parale- 
las e isso pode ser uma dica de que voce 
tenha uma posslvel interagao significati- 
va. Entretanto, contrario a crenca popular, 
nem sempre quando as linhas do grafico 
de interagao se cruzam, teremos uma inte¬ 
ragao significativa. 

Outra complicagao e que, algumas vezes, 
as pessoas desenham graficos de barras em vez 
de graficos de linhas. A Figura 10.12 mostra 
alguns graficos de barras de interagoes entre 
duas variaveis independentes. Os paineis (a) e 
(b) exibem os dados do exemplo usados neste 
capltulo (na verdade, por que nao traga-los?). 
Como voce pode ver, existem duas maneiras 
de apresentar os mesmos dados: o painel (a) 
mostra os dados quando os nlveis de alcool 
estao localizados ao longo do eixo x e barras 
com cores diferentes sao usadas para mostrar 
as medias para homens e mulheres e o painel 
(b) mostra um cenario oposto onde o genero e 
tragado no eixo x e cores diferentes distinguem 


a dose do alcool. Ambos os graficos mostram 
um efeito de interagao. O que voce esta pro- 
curando sao as diferengas entre as barras co- 
loridas em pontos distintos do eixo x. Assim, 
para o painel (a) voce observa as diferengas 
entre as barras escuras e claras do grupo sem 
alcool e, entao, analisa a de 2 canecas e per- 
gunta: “A diferenga entre as barras e distinta 
daquela do grupo sem alcool?”. Nesse caso, as 
barras parecem as mesmas das de sem alcool 
como as de 2 canecas: porem, sem interagao. 
Entretanto, seguimos e observamos as de 4 ca¬ 
necas e perguntamos novamente: “A diferenga 
entre as barras e diferente do que foi visto em 
qualquer outra condigao?”. Nesse caso, a res- 
posta e sim: para sem alcool e 2 canecas as 
barras eram quase da mesma altura, mas para 
os 4 canecas a barra mais clara e muito mais 
alta do que a barra escura. Isso mostra uma 
interagao: o padrao das respostas muda nas 4 
canecas. O painel (b) mostra a mesma coisa, 
mas tragado de uma maneira inversa. Nova¬ 
mente, voce observa o padrao das respostas. 
Assim, observamos os homens e vemos que 
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Figura 10.12 Grafico de barras exibindo interagoes entre duas variaveis. 


o padrao e que as primeiras duas barras tem 
a mesma altura, mas a ultima barra e muito 
mais baixa. O efeito de interagao e mostrado 
acima pelo fato de que para as mulheres ha 
um padrao diferente: todas as tres barras sao 
quase do mesmo tamanho. 

E os paineis (c) e (d): voce acha que exis- 
te uma interagao? Novamente, eles exibem os 
mesmos dados de duas maneiras diferentes, mas 
sao dados distintos dos que usamos neste capf- 
tulo. Primeiro, vamos observar o painel (c): para 


os dados do grupo sem alcool a barra mais clara 
e um pouco maior do que a mais escura; seguin- 
do para os dados de 2 canecas a barra mais clara 
e tambem um pouco mais alta do que a escura e, 
fmalmente, para os dados de 4 canecas, a barra 
clara e um pouco mais alta do que a escura. Em 
todas as condigoes, o mesmo padrao e exibido 
- a barra clara e um pouco mais alta do que a 
escura (isto e, as mulheres escolhem parceiros 
mais atraentes do que os homens apesar do con¬ 
sumo de alcool) - portanto, nao ha interagao. 
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Observando o painel (d), vemos um resultado 
semelhante. Para os homens, o padrao e que a 
taxa de atratividade cai quanto mais alcool e be- 
bido (as barras diminuem em altura) e, entao, 
para as mulheres vemos o mesmo padrao: quan¬ 
to mais se bebe, mais a taxa cai. Isso novamente 
e um indicativo de que nao ha intera^ao: a mu- 
danga em atratividade devido ao alcool e similar 
em homens e mulheres. 

10.6 CALCULANDO 0 TAMANHO DE 
EFEITO @ 



Como vimos nos capitu- 
los anteriores (segbes 8.5 e 
9.7), podemos fazer o SPSS 
produzir o eta quadrado, r] 2 (o 
qual e apenas o r 2 com outro 
nome). Entretanto, voce foi orientado, por ra- 
zoes explicadas em outras segoes, a usar o 
omega quadrado (of). O calculo do omega 
quadrado se torna um pouco mais complicado 
nos delineamentos fatoriais. Howell (2002), 
como sempre, explica muito bem as comple- 
xidades de tudo (e tem uma otima tabela resu- 
mindo os muitos componentes para uma va- 
riedade de situates). Resumindo tudo isso, 
apenas direi que, em primeiro lugar, temos 
que calcular o componente da variancia para 
cada um dos efeitos (os dois efeitos principals 
e o termo de interagao) e o erro e, entao, usar 
isso para calcular o tamanho de efeito para 
cada um. Se denominarmos o efeito principal 
de A e o segundo efeito principal de B e o 
efeito de interagao AxB, os componentes da 
variancia para cada um deles e baseado nas 
raizes quadradas de cada efeito e os tamanhos 
dos efeitos nos quais eles sao baseados: 


mero dos niveis da segunda variavel indepen- 
dente eneo numero de pessoas por condicao. 
Vamos calcular isso para os nossos dados. 
Precisamos observar a Saida 10.3 do SPSS 
para descobrir quadrados medios para cada 
efeito e para o termo erro. Nossa primeira va¬ 
riavel independente foi o alcool. Ela tinha tres 
niveis (portanto, a = 3) e tinha uma media dos 
quadrados de 1666,146. Nossa segunda va¬ 
riavel independente era genero, o qual tinha 
dois niveis (portanto, b = 2) e uma media dos 
quadrados de 168,75. O numero de pessoas 
em cada grupo era de 8 e a media residual 
dos quadrados era de 83,036. Portanto, nossas 
equates ficam: 


(3-l)(1666,146-83,036) 
8x3x2 


65,96 



(2-11(168,75^83,036) _ 1?9 
8x3x2 

(3 -1) (2 -1) (989,062 - 83,036) 
8x3x2 


37,75 


Nos precisamos, tambem, estimar o total da 
variabilidade e isso e apenas a soma das outras 
variaveis mais a media residual dos quadrados: 

^To.al = d 2 a + ° 2 f) + ° 2 «p + MSr 

= 65,96 + 1,79 + 37,75 + 83,04 
= 188,54 

O tamanho de efeito e simplesmente a varian¬ 
cia estimada para o efeito no qual voce esta inte- 
ressado dividido pela variancia total estimada: 

f7 2 

rri 2 _ ^Efeito 

^Efeito — ? 

tffotal 


(a — 1) (MS A — MS r ) 
nab 

2 _ (^~ 1)(MS b — MS r ) 


Gp = 


nab 


.2 _(a-l)(Z>-l)(MS AxB -MS R ) 


a ap ~ 


nab 


Nessas equa 9 oes, a 6 o numero de niveis 
da primeira variavel independente, be o nu- 


Para o efeito principal do alcool, temos: 


2 = g Alcool = 65 ' 96 = Q 35 

^Alcool — - 2 — — U,JJ 


'Total 


188,54 


Para o efeito principal do genero, temos: 


rr z 1 7Q 

^Genero = “= —-= 0,09 

(7 2 188,54 
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Para a interacao do genero e alcool, temos: 


co 


Alcool x Genero 


' Alcool x Genero . 


’ Total 


37,75 

188,54 


0,20 



Para tornar esses valores 
comparaveis ao /; devemos ti- 
rar a raiz quadrada, o que nos 
da os tamanhos de efeito de 
0,59 para o alcool, 0,09 para o 
genero e 0,45 para o termo de interacao. As- 
sim, os efeitos do alcool e a interacao sao mui- 
to grandes, mas o efeito do genero, que nao 
foi significativo na analise principal, e real- 
mente muito pequeno (na verdade, proximo 
de zero). 

E possfvel, tambem, calcular os tamanhos 
de efeito para a nossa analise de efeitos sim¬ 
ples (se voce ler o Quadra 10.2). Esses efeitos 
tern 1 grau de liberdade para o modelo (o que 
significa que eles estao comparando somente 
duas coisas) e nessas situates a F pode ser 
convertida em r usando a equagao seguinte (a 
qual apenas utiliza a razao F e os graus de li¬ 
berdade dos residuos): 1 


F(Uk) 

F(l,gl R )+gk 


Observando o Quadra 10.2, podemos ver 
que temos as razSes F de 1,01, 0,49 e 12,35 
para os efeitos de genero nos grupos sem al¬ 
cool, 2 canecas 4 canecas, respectivamente. 
Para cada um desses, os graus de liberdade 
eram 1 para o modelo e 44 para o resfduo. Por- 
tanto, temos os seguintes tamanhos de efeito: 


Y 

Genero(Sem Alcool) 


Y 

Genero(2Canecas) 


1,01 


1,01 + 44 
0,49 

0,49+44 


= 0,15 


0,10 


1 Se o seu F compara mais do que duas coisas, uma equaqao 

diferente e necessaria (veja Rosenthal, Rosnow e Rubin 
(2000), p. 44), mas prefiro tentar manter os tamanhos de 
efeito em siluacoes nas quais somente duas coisas estao 
sendo comparadas porque a iiucrprcLacao e mais facil. 


^Genero(4Canecas) 

Desse modo, o efeito do genero e muito 
pequeno quando nao ha consumo de alcool e 
quando sao consumidas 2 canecas, mas se tor- 
na grande quando sao consumidas 4 canecas. 

10.7 RELATAND0 OS RESULTAD0S 
DA AN0VA DE D0IS 
FAT0RES (TWO-WAY) © 

Assim como na outra ANOVA que encon- 
tramos, temos que relatar os detalhes da razao 
Feos graus de liberdade dos quais ela foi cal- 
culada. Para os varios efeitos nesses dados as 
razoes F serao baseadas em diferentes graus 
de liberdade: ela foi derivada pela divisao dos 
quadrados medios para o efeito pelos quadra- 
dos medios dos residuos. Para os efeitos do al¬ 
cool e alcool x interacao do genero, os graus 
de liberdade do modelo eram 2 (gl M = 2), mas 
para o efeito do genero os graus de liberda¬ 
de eram somente 1 (gl M =1). Para todos os 
efeitos os graus de liberdade para os residuos 
eram 42 (gl R = 84). Portanto, podemos relatar 
os tres efeitos dessa analise como segue: 

/ Havia um efeito principal significativo da 
quantidade de alcool consumida na boate, 
na atratividade do parceiro selecionado, 
F( 2, 42) = 20,07, p < 0,001, co 2 = 0,35. 
O teste de post hoc de Games-Howell re- 
velou que a atratividade dos parceiros se- 
lecionados era significativamente menor 
apos 4 canecas do que tanto para 2 cane¬ 
cas quanto na situacao sem alcool (ambos 
p < 0,001). A atratividade dos parceiros 
apos 2 canecas e na situagao sem alcool 
nao foi significativamente diferente. 

/ Havia um efeito principal nao significati¬ 
vo de genero na atratividade dos acompa- 
nhantes selecionados F (1, 42) = 2,03, p 
= 0,161V = 0,009. 

/ Havia um efeito de interagao significa¬ 
tivo entre a quantidade de alcool consu¬ 
mida e o genero da pessoa selecionan- 
do um companheiro, na atratividade do 


12,35 
12,35 + 44 


:0,47 
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companheiro selecionado, F( 2, 42) = 
11,91 , p < 0,001, co 2 = 0,20. Isso indica 
que os generos masculinos e femininos 
foram afetados de maneira diferente pelo 
alcool. Especificamente, a atratividade 
dos parceiros foi similar em homens (M 
= 66,88, SD = 10,33) e mulheres (M = 
60,63, SD = 4,96) no grupo sem alcool; 
a atratividade dos parceiros foi similar 
em homens (M = 66,88, SD = 12,52) e 
mulheres (M = 62,50, SD = 6,55) apos 
2 canecas; entretanto, a atratividade dos 
parceiros selecionados pelos homens (M 
= 35,63, SD = 10,84) foi significativa- 
mente mais baixa do que aqueles sele¬ 
cionados pelas mulheres (M = 57,50, 
SD = 7,07) apos 4 canecas. 

10.8 AN0VA DE D0IS FAT0RES COMO 
REGRESSAO © 

Vimos na Secjao 8.2.2 que a ANOVA de 
um fator independente pode ser conceitualizada 
como uma equagao de regressao (um modelo li¬ 
near geral). Nesta se§ao, iremos considerar como 
estendemos esse modelo linear para incorporar 
duas variaveis independentes. Para manter as 
coisas tao simples quanto possfvel, imagine que 
temos somente dois nfveis da variavel alcool em 
nosso exemplo (sem alcool e 4 canecas). Assim, 
temos duas variaveis, cada uma com dois nfveis. 
Todos os modelos lineares gerais que considera- 
mos neste livro assumem a forma geral de: 

Saida,- = (Modelo,) + erro, 

Por exemplo, quando nos deparamos com 
a regressao mtiltipla no Capftulo 5, vimos que 
esse modelo estava escrito como (5.9): 

Yj = (b 0 + b l X l + b 2 X 2 + .... b„X n ) + e ; 

Tambem, quando nos deparamos com a 
ANOVA de um fator independente, adapta- 
mos esse modelo de regressao para concei- 
tualizar nosso exemplo do Viagra como (veja 
equa^ao (8.2)): 

Libido,- = ( b 0 + 7> 2 Alto, 4- fo,Baixo,.) + e,- 


Nesse modelo, as variaveis alta e baixa 
eram variaveis auxiliares (isto e, variaveis que 
somente podem ter dois valores: 0 e 1). No 
nosso exemplo atual, temos duas variaveis: 
genero (masculino e feminino) e alcool (sem e 
4 canecas). Podemos codificar cada uma delas 
com 0 e 1: por exemplo, podemos codificar o 
genero como masculino = 0, feminino = 1; 
e podemos codificar a variavel alcool como 0 
= sem, 1=4 canecas. Podemos, entao, co- 
piar diretamente o modelo que tfnhamos na 
ANOVA de um fator independente: 

Atratividade; = ( b 0 + b 2 Genero, + 7> 2 Alcool;) 

+ 

Agora, os espertos dentre voces podem 
dizer: “Aonde foi o termo de intera^ao?”. E 
claro que temos que incluf-lo tambem e, as¬ 
sim, o modelo simplesmente se estende para 
se tornar (primeiro expresso no geral e, entao, 
em termos desse exemplo especffico): 

Saida,- = (b 0 + b, A, + b 2 B, 

+ bjABJ + £; 

Atratividade; = ( b 0 + T^Genero, + fc 2 Alcool ; 

+ fejlnteragao;) + e t (10.1) 

A questao e: como codificamos o termo de 
intera 5 ao? O termo de intera 9 ao representa o 
efeito combinado de alcool e genero e, na ver- 
dade, para conseguir qualquer termo de intera- 
9 ao na regressao voce simplesmente multiplica 
as variaveis envolvidas naquele termo de intera- 
9 ao. Essa e a razao pela qual voce ve termos de 
intera 9 ao escritos como genero x alcool, por- 
que em termos de regressao a variavel de intera- 
9 ao literalmente e as duas variaveis multiplica- 
das entre si. A Tabela 10.2 mostra as variaveis 
resultantes para a regressao (note que a variavel 
de intera 9 ao e simplesmente o valor da variavel 
auxiliar genero multiplicada pelo valor da va¬ 
riavel auxiliar alcool). Assim, por exemplo, um 
homem recebendo 4 canecas de alcool tera um 
valor de 0 para a variavel de genero, 1 para a 
de alcool e 0 para a variavel de intera 9 ao. As 
rnedias do grupo para as varias combina 9 oes de 
genero e alcool estao tambem inclufdas porque 
elas serao liteis no seu devido tempo. 
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Tabela 10.2 

Esquema de codificagao para a ANOVA fatorial 



Genero 

Alcool 

Auxiliar 1 (Genero) 

Auxiliar 2 (Alcool) 

Interagao 

Media 

Masculino 

Nenhum 

0 

0 

0 

68,875 

Masculino 

4 canecas 

0 

1 

0 

35,625 

Feminino 

Nenhum 

1 

0 

0 

60,625 

Feminino 

4 canecas 

1 

1 

1 

57,500 


Para determinar o que os valores b repre- 
sentam nesse modelo, podemos fazer o mes- 
mo que fizemos para o teste t e para a ANOVA 
de um fator independente; isto e, veja o que 
acontece quando inserimos valores dos nossos 
previsores (genero e alcool)! Para comecar, 
vejamos o que acontece quando observamos 
os homens que nao ingeriram alcool. Nesse 
caso, o valor de genero e 0, o valor de alcool 
eOeo valor da interacao tambem e 0. A safda 
que previmos (como na ANOVA de um fator 
independente) e a media desse grupo (66,875), 
assim, nosso modelo fica: 

Atratividade ; = b Q + ^Genero, + b 2 Alcool, 

+ fe-Jnteracao, 

■^Homens,Sem = b 0 + (b > 1 X 0) + ( b 2 X 0) 

+ (i> 3 X 0) 

b 0 -^Homens, Sem 

b 0 = 66,875 

Assim, a constante b 0 no modelo represen- 
ta a media do grupo para o qual todas as varia- 
veis estao codificadas como 0. Desse modo, e 
o valor da media da categoria base (nesse caso, 
homens que nao beberam alcool). Agora, va- 
mos ver o que acontece quando observamos as 
mulheres que nao beberam alcool. Nesse caso, 
a variavel genero e 1 e as variaveis alcool e in- 
teracao permanecem 0. Lembre, tambem, que 
o b 0 e a media dos homens que nao beberam 
alcool. A safda e a media para as mulheres que 
nao beberam alcool; portanto, a equa 9 ao fica: 

Atratividade, = b 0 + b l Genero, + b 2 Alcool, 

+ fcjlnteragao, 

•^Mulheres, Sem — ^0 + Q>\ X 1) + (b 2 X 0) 

+ (b 3 X 0) 

^Mulheres, Sem -^Homens, Sem A b\ 


h = X X 

u 0 -^Mulheres, Sem — -^Homens, Sem 

= 60,625 - 66,875 
= -6,25 

Assim, b { no modelo representa a diferenga 
entre homens e mulheres (para aqueles) que nao 
beberam alcool. De uma forma mais geral pode¬ 
mos dizer que e o efeito do genero para a catego¬ 
ria base do alcool (a categoria base sendo aquela 
codificada com 0, nesse caso, sem alcool). Ago¬ 
ra, vamos observar os homens que beberam 4 
canecas de alcool. Nesse caso, a variavel genero 
e 0, a variavel do alcool e 1 e a variavel de inte- 
rai^ao permanece 0. Podemos, tambem, trocar o 
b 0 pela media dos homens que beberam alcool. 
A safda e a media para os homens que beberam 
4 canecas; portanto, a equagao fica: 

-^Homens, 4 canecas ^0 A (/l] X 0) A (/l 2 X 1) 

+ (b 3 X 0) 

X — h 4- h 

Homens. 4 canecas y 0 Ty 2 

^Homens, 4 canecas -^Homens, Sem ^2 

b 3 2f Homens 4 canecas Womens. Sem 

= 35,625 - 66,875 
= -31,25 

Assim, o b 2 no modelo representa a di- 
feren 9 a entre sem alcool e 4 canecas para os 
homens. De uma forma mais geral, e o efeito 
do alcool na categoria base de genero (isto e, a 
categoria de genero que foi codificada com um 
0, nesse caso, homens). Finalmente, podemos 
observar as mulheres que beberam 4 canecas. 
Nesse caso, a variavel genero e I, a variavel 
alcool e 1 e a variavel intera 9 ao e tambem 1. 
Podemos, tambem, substituir b Q , /? pelo o que 
agora sabemos que eles representam. A safda 
e a media para as mulheres que beberam 4 ca¬ 
necas. Portanto, a equa 9 ao fica: 
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^Mulheres,4 canecas ^0 A \ X 1)4"" 2 X ) ) 

+ (63 X 1 ) 

-^Mulheres,4 canecas ^0 4~ ^1 4“ ^2 4~ ^3 

^Mulheres,4 canecas ^Homens, Sem (-^Mulheres, sem 

^Homens, Sem) A (-^Homens,4 canecas 
^\ [omens, Sem) 4 “ ^3 

V _ Y _L V 

y ‘ Mulhcrcs. 4 canecas ^Mulheres, Sem ' -^Homens,4 canecas 

^Homens, Sem) 4~ ^3 
^3 ^Homens, Sem A" Mulheres, Sem 

i Y _ Y 

1 zv Mulheres, 4 canecas A [ Iomens,4 canecas 

= 66,875 - 60,625 + 57,500 
- 35,625 
= 28,125 


Assim, o b 3 no modelo realmente compara 
a diferenca entre homens e mulheres na condi- 
gao sem alcool com a diferenca entre homens 
e mulheres na condicao 4 canecas. Em outras 
palavras, ele compara o efeito do genero apos 
sem alcool ao efeito do genero apos 4 cane¬ 
cas . 2 Se voce pensar em termos de um grafico 
de interagao, isso faz sentido. Por exemplo, o 
lado esquerdo do alto da Figura 10.13 mostra 
o grafico de intcracao para esses dados. Agora 


2 De fato, se voce reorganizar os termos na cquacao. 
vera que podera tambem escrever a intcracao de forma 
contraria: ela representa o efeito do alcool nos homens 
comparados as mulheres. 





25 


Nenhum 4 Canecas 

Consumo de Alcool 


Figura 10.13 llustragao das situagoes do exemplo anterior. 
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imagine que calculamos a diferenga entre ho- 
mens e mulheres para os grupos sem alcool. 
Isso seria a diferenga entre as linhas do grafi- 
co para o grupo sem alcool (a diferenga entre 
as medias do grupo, que e 6,25). Se, entao, 
fizermos o mesmo para o grupo de 4 canecas, 
encontraremos que a diferenga entre homens 
e mulheres e de 21,875. Se tragarmos esses 
dois valores corno um novo grafico, conse- 
guiremos uma linha conectando 6,25 a 21,875 
(veja a parte de baixo da esquerda da Figura 
10.13). Isso reflete a diferenga entre o efeito 
do genera apos sem alcool comparado a apos 
4 canecas. Sabemos que os valores de beta 
representam as inclinagoes (gradientes) das 
linhas e, de fato, o b 3 no nosso modelo e a in- 
clinagao dessa linha! Vejamos, tambem, o que 
acontece quando nao existe um efeito de inte- 
ragao: o lado direito da Figura 10.13 mostra os 
mesmos dados, exceto que as medias para as 
mulheres que beberam 4 canecas mudou para 
30. Se calcularmos a diferenga entre homens 
e mulheres apos sem alcool, encontraremos o 
mesmo que antes: 6,25. Se calcularmos a di¬ 
ferenga entre homens e mulheres apos 4 cane¬ 
cas encontraremos 5,625. Se nos, novamente, 
tragarmos essas diferengas num novo grafico 
encontraremos uma linha praticamente hori¬ 
zontal. Assim, quando nao existe interagao, 
as linhas conectando o efeito do genera apos 
sem alcool e apos 4 canecas e o b 3 resultante 
em nosso modelo seria proximo a 0 (lembre 
que uma inclinagao zero significa uma linha 
horizontal). Na verdade, seu valor real seria 
6,25 - 5,625 = 0,625. 



0 arquivo GogglesRegres- 
sion.sav content as variaveis au- 
xiliares usadas nesse exemplo, e 
para provar que ele funciona, 
use esse arquivo e execute uma 
regressao multipla nos dados. A tabela dos coefi- 
cientes resultantes esta na Saida 10.6 do SPSS. E 
importante notar que os varios valores de beta 
sao os mesmos que acabamos de calcular, o que 
deveria, espero, convence-lo de que a ANOVA 
fatorial e, como em tudo que voce viu, apenas 
uma regressao com uma roupa diferente! 

Espero ter mostrado a voce nesse exemplo 
que ate mesmo as ANOVAs complexas sao ape¬ 
nas formas de regressao (um MLG). Voce fica- 
ra feliz em saber (eu ficarei, com certeza) que 
essa e a ultima vez que falarei sobre a ANOVA 
como MLG. Espero que voce tenha entendido 
que podemos continual' adicionando variaveis 
independentes em nosso modelo. O que acon¬ 
tece e que essas novas variaveis sao apenas adi- 
cionadas em uma equagao de regressao multipla 
com um valor beta associado. Assim, qualquer 
ANOVA (nao importa quao complexa) e apenas 
uma forma de regressao multipla. 


10.9 0 QUE DESC0BRIM0S SOBRE 
ESTATISTICA? © 

Este capitulo foi apenas uma amostra do 
que e uma ANOVA fatorial. Ainda veremos 
mais sobre a ANOVA fatorial nos dois pro- 
ximos capitulos, mas, por enquanto, obser- 
vamos situagoes onde existem duas variaveis 
independentes e diferentes pessoas foram 


Saida 10.6 do SPSS 


Coefficients a (Coeficientes) 



Unstandardized Coefficients 
(Coeficientes nao-padronizados) 

Standardized Coefficients 
(Coeficientes padronizados) 



Model (Modelo) 

B 

Std. Error 
(Erro Padrao) 

Beta 

t 

Sig. 

1 (Constant) (Constante) 

66.875 

3.055 


21.890 

0.000 

Gender (Genero) 

-6.250 

4.320 

-0.219 

-1.447 

0.159 

Alcohol Consumption 
(Consumo de Alcool) 

-31.250 

4.320 

-1.094 

-7.233 

0.000 

Interaction (Interagao) 

28.152 

6.110 

0.853 

4.603 

0.000 


a. Dependent VariableAttractiveness of Date (Variavel dependente: Atratividade do parceiro) 
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usadas em todas as condigoes experimentais. 
Comegamos observando como calcular as va- 
rias somas dos quadrados nessa analise, mas 
o mais importante que vimos foi que conse- 
guimos tres efeitos: dois efeitos principals (o 
efeito para cada variavel independente) e um 
efeito de interagao. Aprendemos como essa 
analise e feita no SPSS e como a salda e inter- 
pretada. Muito disso foi similar as ANOVAs 
que vimos nos capftulos anteriores, mas uma 
grande diferenga foi o termo de interagao. 
Exploramos as interagoes (e, especialmente, 
graficos de interagoes) para ver como e uma 
interagao e como traga-la. Os leitores corajo- 
sos tambem descobriram como seguir uma in¬ 
teragao com uma analise de efeitos simples e 
que ate mesmo ANOVAs complexas sao ana- 
lises de regressao simples disfargadas. Final- 
mente, descobrimos que calcular os tamanhos 
de efeito em um delineamento fatorial da 
uma dor de cabega tremenda. Ate agora nos 
esquivamos dos delineamentos de medidas 
repetidas, mas no proximo capitulo, vou ser 
obrigado a abordar esse assunto.© 

10.10 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• Efeito alcool ( Beer-Goggles ) 

• ANOVA fatorial 

• Fatores 

• Delineamento fatorial independente 

• Efeito de interagao 

• Graficos de interagao 

• Efeito principal 

• Delineamentos mistos 

• Delineamento fatorial relacionado 

• Analises de um unico efeito 


10.11 TAREFAS DO ALEX ESPERTO 


Tarefa 1: O gosto musical das 
pessoas tende a mudar a medi- 
da que envelhecem (meus pais, 
por exemplo, apos anos escu- 
tando a musicas relativamente 
boas quando eu era uma crianga nos anos 
de 1970, quando chegaram aos quarenta 



desenvolveram uma obsessao preocupan- 
te por musica country - talvez tenha sido 
o estresse de me ter como um filho ado- 
lescente!). De qualquer modo, isso me 
preocupa muito porque temo que no futu¬ 
re eu tambem escute as musicas de Garth 
Brooks e pense: “Menino, sera que subes- 
timei o imenso talento de Garth quando 
eu estava na casa dos 20?”. Assim, pensei 
em fazer uma pesquisa para descobrir se 
minha sorte esta realmente selada ou se e 
possfvel ser velho e gostar de boa musica. 
Primeiro, peguei dois grupos de pessoas 
(45 pessoas em cada grupo): um grupo 
continha pessoas jovens (o que eu arbitra- 
riamente classifiquei como menos de 40 
anos) e o outre grupo continha individuos 
mais maduros (acima de 40 anos). Essa e 
minha primeira variavel independente, 
age (idade), e ela tem dois nrveis (menos 
do que ou mais do que 40 anos). Entao, 
dividi cada um desses grupos de 45 em 
tres grupos menores de 15 e dei a tarefa 
de escutar Fugazi 3 , ABBA ou Barf Grooks 
(que e um musico country e western me¬ 
nos conhecido e nao deve ser confundido 
com outra pessoa que tenha um nome pa- 
recido). Essa e a minha segunda variavel 
independente, music (musica) e tem tres 
nrveis (Fugazi, ABBA ou Barf Grooks). 
Havia diferentes participantes em todas as 
condigoes, o que significa que dos 45 
abaixo de 40, 15 escutaram Fugazi, 15 es- 
cutaram ABBA e 15 escutaram a Barf 
Grooks; da mesma forma, dos 45 acima 
dos 40, 15 escutaram a Fugazi, 15 escuta¬ 
ram ABBA e 15 escutaram Barf Grooks. 
Apos escutar uma musica, cada pessoa 
avaliou-a numa escala variando de -100 
(eu odeio essa musica hornvel) passando 
por 0 (eu sou completamente indiferente) 
ate +100 (eu gosto muito dessa musica). 
Essa variavel e denominada liking (gos¬ 
tar). Os dados estao no arquivo Fugazi. 
sav. Execute uma ANOVA de dois fatores 
independentes com esses dados. © 


3 Veja http://www.dischord.com 
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• Tarefa 2: Usando o quadro 10.2, mude 
a sintaxe no GooggleSimpleEffects.sps 
para observar os efeitos do alcool nos di- 
ferentes nrveis do genero. © 

• As respostas estao no arquivo Answers 
(ChapterlO).pdf e a tarefa 1 e um exem- 
plo de Field e Hole (2003) logo, ha mais 
detalhes sobre ela la. 

10.12 LEITURAS COMPLEMENTARES 

HOWELL, D. C. Statistical methods for 
psychology (5 11 edition). Belmont (CA): 
Duxbury, 2002. Capitulo 13. 


ROSENTHAL, R„ ROSNOW, R. L„ RUBIN, 

D. B. Contrasts and effect sizes in behavioral 
research: a correlacional approach. Cambridge 
(MA): Cambridge University Press, 2000. Esse 
livro e bem avangado, mas e o melhor sobre 
contrastes e estimativas do tamanho de efeito. 

ROSNOW, R. L„ ROSENTHAL, R. Beginning 
behavioral research: a conceptual primer 
(5“' edition). Englewood Cliffs (NJ): Pearson/ 
Prentice Hall, 2005. Tern alguns capltulos 
maravilhosos sobre a ANOVA com um foco 
especffico na estimativa do tamanho de efeito 
e alguns otimos comentarios sobre o que as 
interagoes realmente significam. 



11 

DELINEAMENTOS DE MEDIDAS 
REPETIDAS (MLG 4) 


11.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 

Nos ultimos tres capftulos, aprendemos 
sobre um procedimento denominado ANO- 
VA, usado para testar diferencas entre varias 
medias. Ate agora nos concentramos em si¬ 
tuates em que pessoas diferentes contribuem 
para medias diferentes; em outras palavras, 
pessoas diferentes participam de condi^oes 
experimentais diferentes. Na verdade, nao e 
preciso que sejam pessoas diferentes (tenho a 
tendencia de escrever pessoas porque sou um 
psicologo, assim, passo minha vida torturan- 
do, quero dizer, testando criancas em nome da 
ciencia), podem ser plantas diferentes, compa- 
nhias diferentes, diferentes lotes de terra, di¬ 
ferentes grupos virais, diferentes bodes ou ate 
mesmo diferentes ornitorrincos. De qualquer 
modo, o ponto e que eu ignorei completamen- 
te as situa£oes nas quais as mesmas pessoas 
(plantas, bodes, hamsters, lideres galacticos 
verdes do espa§o com sete olhos, ou seja la o 
que for) contribuem para as diferentes medias. 
Agora finalmente veremos o que acontece 
quando executamos uma ANOVA com dados 
de medidas repetidas. Primeiro, iremos obser- 
var detalhadamente uma hipotese adicional 
que precisamos considerar quando usamos os 


delineamentos de medidas repetidas ( esferi- 
cidade). Depois, iremos observar a teoria por 
tras da ANOVA de medidas repetidas quando 
temos uma variavel independente simples. 
Iremos examinar um exemplo no SPSS antes 
de verificar situacdes onde mensuramos duas 
variaveis independentes. Ao concluir este ca- 
pftulo, voce sabera quase tudo o que precisa 
sobre a ANOVA de medidas repetidas. 

11.2 INTRODUCAO AOS DELINEAMENTOS 
DE MEDIDAS REPETIDAS © 

“Medidas repetidas” e um termo usado 
quando as mesmas pessoas participam em todas 
as condigoes de um experimento. Por exemplo, 
voce pode testar os efeitos do alcool na diversao 
de uma festa. Algumas pessoas podem beber 
muito alcool sem realmente sentir as conse- 
quencias, enquanto outras, como eu, precisam 
tomar somente um gole de cerveja para sentir 
seus efeitos. Portanto, e importante controlar, 
para as diferencas individuals, a tolerancia ao 
alcool. Para controlar essas diferen 9 as indivi¬ 
duals, podemos testar as mesmas pessoas em 
todas as condigoes do experimento: testanamos 
cada pessoa apos o consumo de 1 caneca, 2 ca- 
necas, 3 canecas e 4 canecas de cerveja. Seria 
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dado ao participante, apos cada copo, um ques- 
tionario avaliando sua diversao na festa. Cada 
participante fomeceria um escore representando 
sua diversao antes da manipulagao experimen¬ 
tal (sem o consumo de alcool), apos 1 caneca, 2 
canecas e assim por diante. Esse delineamento 
foi planejado para o uso de medidas repetidas. 

Esse tipo de delineamento tem muitas van- 
tagens. Mais importante, ele reduz a variabili- 
dade nao-sistematica no delineamento (veja o 
Capftulo7) e, assim, fornece um poder maior 
para detectar efeitos. As medidas repetidas 
tambem sao mais economicas porque menos 
participantes sao exigidos. Mas existe uma des- 
vantagem: na ANOVA entre grupos a precisao 
do teste F depende da hipotese de que escores 
em condigoes diferentes sao independentes 
(Scariano e Davenport, 1987, documentaram 
algumas das consequencias da violagao dessa 
hipotese). Quando medidas repetidas sao usa- 
das, essa hipotese e violada: escores tirados 
de diferentes condigoes experimentais prova- 
velmente estao relacionados porque eles vem 
do mesmo participante. Desse modo, o teste 
F convencional nao sera preciso. O relaciona- 
mento entre escores em diferentes condigSes de 
tratamento significa que uma hipotese adicional 
tem que ser feita e, simplificando, presumimos 
que o relacionamento entre pares de condigoes 
experimentais seja similar (isto e, o nfvel de 
dependencia entre condigoes experimentais e 
aproximadamente igual). Essa hipotese e deno- 
minada hipotese da esfericidade, nome diffcil 
de pronunciar quando voce esta dando aulas de 
estatfstica as 9 horas da manha. 

11.2.1 A suposicao de esfericidade © 

Todos aprendemos 
(especialmente se voce 
leu este livro) que e 
crucial termos homo- 
geneidade de variancia 
entre conduces quando 
analisamos dados de 
participantes diferentes, mas geralmente presu¬ 
mimos que esse problema “desaparece” nos de- 
lineamentos de medidas repetidas. Isso nao e 
verdade, e a hipotese de esfericidade pode ser 


igualada a hipotese de homogeneidade da va¬ 
riancia na ANOVA entre grupos. A esfericidade 
(representada por £ e algumas vezes referida 
como circularidade) e uma condigao mais geral 
da simetria composta. A simetria composta se 
mantem verdadeira quando ambas as variancias 
entre condigoes sao iguais (isso e o mesmo que 
a homogeneidade da hipotese da variancia em 
delineamentos entre grupos) e as covariancias 
entre pares de condigoes sao iguais. Assim, pre¬ 
sumimos que a variagao dentre as condigoes ex¬ 
perimentais e muito parecida e que duas condi¬ 
goes nao sao mais dependentes do que quaisquer 
outras duas. Embora a simetria composta tenha 
se mostrado uma condigao suficiente para a 
ANOVA usando dados de medidas repetidas, 
ela nao e uma condigao necessaria. A esfericida¬ 
de e uma forma menos restritiva da simetria 
composta (de fato, as primeiras pesquisas sobre 
ANOVA de medidas repetidas confundiam a si¬ 
metria composta com esfericidade). A esferici¬ 
dade se refere a igualdade das variancias das 
diferengas entre nfveis de tratamento. Assim, se 
voce for tomar cada par dos nfveis de tratamento 
e calcular as diferengas entre cada par dos esco¬ 
res, e necessario que essas diferengas tenham 
variancias iguais. Assim, voce precisa, pelo 
menos, de tres condigoes para que a esferici¬ 
dade exista. 

11.2.2 Como a esfericidade e medida? © 

A maneira mais simples de verificar se a 
hipotese de esfericidade foi confirmada e cal¬ 
cular as diferengas entre os pares dos escores 
em todas as combinagoes dos nfveis de trata¬ 
mento. Uma vez que isso foi feito, voce pode 
calcular a variancia dessas diferengas. A Ta- 
bela 11.1 mostra os dados de um experimento 
com tres condigoes. As diferengas entre pares 
de escores sao computadas para cada partici¬ 
pante e a variancia para cada conjunto de di¬ 
ferengas e calculado. Vimos acima que a esfe¬ 
ricidade e confirmada quando essas variancias 
sao aproximadamente iguais. Para esses da¬ 
dos, a esfericidade ira se manter quando: 

variancia A _ B « variancia A _ c ss variancia B _ c 
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Tabela 11.1 Dados hipoteticos para ilustrar os calculos da variancia 
das diferengas entre condigoes 


9 

12 

7 

-3 

2 

5 

15 

15 

12 

0 

3 

3 

25 

30 

20 

-5 

5 

10 

35 

30 

28 

5 

7 

2 

30 

27 

20 

3 

10 

7 



Variancia 

17,0 

10,3 

10,3 


-C B-C 


Grupo A Grupo B Grupo C A-B 


Nesses dados existe um desvio da esferi- 
cidade porque a variancia das diferengas entre 
as condigdes A e B (17,0) e maior do que a 
variancia das diferengas entre A e C e entre B 
e C (10,3). Entretanto, esses dados tern circu- 
laridade local (ou esfericidade local) porque 
duas das variancias das diferengas sao iguais. 
Portanto, a hipotese da esfericidade foi confir- 
mada para quaisquer comparagoes multiplas 
envolvendo essas condigoes (para uma discus- 
sao sobre circularidade local, veja Rouanet e 
Lepine, 1970). O desvio da esfericidade nos 
dados da Tabela 11.1 nao parece rnuito forte 
(todas as variancias sao aproximadamente 
iguais), mas podemos avaliar se o desvio e 
forte o suficiente para exigir uma agao? 

11.2.3 Interpretando as violates da 
hipotese de esfericidade © 

O SPSS produz o teste de Mauclily, o 
qual testa a hipotese de que as variancias das 
diferengas entre condigoes sao iguais. Portan¬ 
to, se o teste estatfstico de Mauchly e signifi¬ 
cative (isto e, tern um valor de probabilidade 
menor do que 0,05), devemos concluir que 
existem diferengas significativas entre as va¬ 
riancias das diferengas; portanto, a condigao 
de esfericidade foi violada. Se, entretanto, o 
teste estatfstico de Mauchly nao e significati- 
vo (isto e, p > 0,05), e razoavel concluir que 
as variancias das diferengas nao sao signifi- 
cativamente diferentes (isto e, elas sao apro¬ 
ximadamente iguais). Resumindo, se o teste 
de Mauchly e significativo, precisamos ser 
cautelosos com as razoes F produzidas pelo 
computador. 



11.2.4 Qual e o efeito de violar a 
hipotese de esfericidade? © 

Rouanet e Lepine (1970) 
forneceram um relato detalhado 
da validade da razao F sob as 
violagoes da hipotese da esferi¬ 
cidade. Eles argumentaram que 
existem duas razoes F diferentes que podem ser 
usadas para validar comparagoes de tratamento 
denominadas F’eF”, respectivamente. F ’se re- 
fere a razao F derivada da media dos quadrados 
da comparagao em questao e o termo erro espe- 
cffico para a comparagao de interesse - essa e a 
razao F normalmente usada. F” e derivada nao 
do quadrado medio do erro especffico, mas dos 
quadrados medios do erro total para todas as 
comparagoes de medidas repetidas. Rouanet e 
Lepine (1970) argumentaram que F’ tern menos 
poder do que F”, assim, talvez esse teste estatfs¬ 
tico nao detecte os efeitos genufnos. Alem disso, 
eles mostraram que para F’ ser valida, a esferi¬ 
cidade deve se manter para a comparagao espe- 
cifica em questao (veja tambem Mendoza, Too- 
thaker e Nicewander, 1974). P”’exige somente 
uma circularidade geral (isto e, todo o conjunto 
de dados deve ser circular), mas por causa da 
natureza nao-recfproca da circularidade e sime- 
tria composta, a nao exige simetria compos- 
ta, embora a F’ exija. Assim, dado que F’ 6 a 
estatistica geralmente usada, o efeito da viola- 
gao da esfericidade e a perda de poder (compa- 
rada quando F” e usado) e um teste estatfstico 
(razao F), o qual nao pode ser 
comparado aos valores tabula- 
dos da distribuigao F (para mais 
detalhes veja Field, 1998a). 
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11.2.5 0 que fazer se a hipotese de 
esfericidade for violada? © 

Se os dados violam a hipotese de esferi¬ 
cidade, existem varias corregoes que podem 
ser aplicadas para produzir uma razao F va- 
lida. O SPSS produz tres corregoes baseadas 
nas estimativas da esfericidade defendidas 
por Greenhouse e Geisser (1959) e Huynh e 
Feldt (1976). Ambas estimativas utilizam um 
fator de corregao aplicada aos graus de liber- 
dade usados para avaliar a razao F observada. 
O calculo dessas estimativas esta alem do es- 
copo deste livro (leitores interessados devem 
consultar Girden, 1992); precisamos saber so- 
mente que as tres estimativas diferem. A cor¬ 
regao de Greenhouse e Geiser (usualmente 
denotada como e) varia entre \/(k - 1) (onde 
he o numero das condigoes das medidas re- 
petidas) e 1. Quanto mais proximo e estiver 
de 1,00, mais homogeneas serao as variancias 
das diferengas e portanto os dados estarao 
mais proximos da esfericidade. Por exemplo, 
numa situagao na qual existem cinco condi¬ 
goes, o limite mais baixo de s sera de 1/(5 - 1) 
ou 0,25 (conhecido como a estimativa limite 


Huynh e Feldt 
(1976) relataram 
que quando a esti¬ 
mativa de Gree¬ 
nhouse e Geisser e 
maior do que 0,75, 
muitas hipoteses 
nulas falsas nao sao 
rejeitadas (isto e, a 
corregao e muito conservadora) e Collier, 
Baker, Mandeville e Hayes (1967) mostraram 
que isso tambem aconteceu com uma estima¬ 
tiva de esfericidade de 0,90. Huynh e Feldt, 
portanto, propuseram sua propria corregao 
menos conservadora (usualmente denotada 
como s). Entretanto, Maxwell e Delaney 
(1990) relatam que s superestima a esfericida¬ 
de. Stevens (1992), portanto, recomenda cal- 
cular a media das duas e ajustar o gl para esse 
valor medio. Girden (1992) recomenda que 
quando a estimativa da esfericidade e maior 
do que 0,75, a corregao de Huynh-Feldt deve 


inferior da esfericidade). 



ser usada, mas quando a estimativa da esferi¬ 
cidade for menor do que 0,75 ou nada e co¬ 
nhecido sobre a esfericidade, a corregao Gree¬ 
nhouse e Geisser deve ser utilizada. Veremos 
como usar esses valores no devido tempo. 

Uma ultima opgao para dados que violam 
a esfericidade e usar a estatfstica teste mul- 
tivariada (MANOVA - veja o Capftulo 14), 
porque ela nao depende da hipotese da esferi¬ 
cidade (veja O’Brien e Kaiser, 1985). A MA¬ 
NOVA evita a hipotese de esfericidade (e to- 
das as consideragoes correspondentes sobre as 
razoes F apropriadas e corregoes) usando um 
termo erro especffico para contrastes com 1 gl 
e, portanto, cada contraste e somente associa- 
do com seu termo erro especffico (em vez dos 
termos erro combinados usados na ANOVA). 
A MANOVA e tratada em profundidade no 
Capftulo 14, mas o procedimento de medidas 
repetidas do SPSS produz automaticamente 
estatfsticas teste multivariadas. 

Existe uma troca no poder 
do teste entre as abordagens 
univariada e multivariada (em- 
bora alguns autores argumen- 
tem que isso pode ser resolvido 
com um domfnio adequado das tecnicas - 
O’Brien e Kaiser, 1985). Davidson (1972) 
comparou o poder das tecnicas univariadas 
ajustadas com as do T 2 do Hotelling (um teste 
estatfstico MANOVA) e descobriu que a tecni- 
ca univariada era relativamente menos podero- 
sa para detectar pequenas mudangas confiaveis 
entre condigoes altamente correlacionadas 
quando outras condigoes menos correlaciona¬ 
das estavam tambem presentes. Mendoza e co- 
laboradores (1974) conduziram um estudo 
Monte Carlo comparando as tecnicas univaria¬ 
das e multivariadas sob violagoes de simetria e 
normalidade composta e descobriram que “a 
medida que o grau de violagao da simetria 
composta aumenta, o poder empfrico para os 
testes multivariados tambem aumenta. Em 
contraste, o poder para os testes univariados 
geralmente diminui” (p. 174). Maxwell e Dela¬ 
ney (1990) observaram que o teste univariado 
e relativamente mais poderoso do que o teste 
multivariado a medida que n diminui e propos 
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que “a abordagem multivariada nao deve pro- 
vavelmente ser usada se o n e menor do que a 
+ 10 (a e o numero de niveis para as medidas 
repetidas)” (p.602). Como uma regra, parece 
que quando temos uma grande viola^ao na es- 
fericidade (e < 0,7) e o tamanho da amostra e 
maior do que (a + 10) os procedimentos da 
multivariada sao mais poderosos, enquanto 
com tamanhos da amostra pequenos ou quan¬ 
do a esfericidade existe (e > 0,7), a abordagem 
univariada e preferfvel (Stevens, 1992). Vale a 
pena notar, tambem, que o poder da MANOVA 
aumenta ou diminui como uma funcao das cor- 
rela^oes entre as variaveis dependentes (Cole, 
Maxwell, Arvey e Salas, 1994), 
assim, o relacionamento entre 
as condicoes de tratamento tam¬ 
bem deve ser considerado. 

11.3 TEORIA DA ANOVA DE MEDIDAS 
REPETIDAS DE UM FATOR © 

Na ANOVA de medidas repetidas, o efei- 
to do nosso experimento aparece na variancia 
entre participantes (em vez da variancia entre 
grupos). Lembre que na ANOVA independente 
(Segao 8.2), a variancia dentre participantes e a 
nossa variancia residual (SS R ); ela e a variancia 
criada por diferencas individuals no desempe- 
nho. Essa variancia nao esta contaminada pelo 
efeito experimental porque todas as manipula¬ 
tes foram feitas em pessoas diferentes. Entre - 
tanto, quando realizamos nossa manipulacao 
experimental com as mesmas pessoas, a va¬ 
riancia dentre participantes sera constitmda de 
duas coisas: do efeito da nossa manipulacao e, 
como anteriormente, de diferencas individuals 
no desempenho. Assim, algumas variates 
dentre sujeitos vein dos efeitos da nossa mani¬ 
pulacao experimental: fizemos coisas diferen¬ 
tes em cada manipulacao experimental com os 
participantes e, assim, a variancia nos escores 
de um indivfduo sera, parcialmente, devido 
a essas manipulates. Por exemplo, se todos 
tiverem escores mais altos em uma condicao 
do que na outra, e razoavel presumir que isso 
nao aconteceu por acaso, mas porque fizemos 
algo diferente com os participantes em uma 


das condicoes comparada com outra qualquer. 
Porque fizemos a mesma coisa com todos em 
uma condicao particular, qualquer variacao 
que nao possa ser explicada pelas manipula¬ 
tes que realizamos deve ser devido a fatores 
aleatorios fora do nosso controle, nao-relacio- 
nados com nossas manipulates experimen- 
tais (podemos chamar isso de “erro”). Como 
na ANOVA independente, usamos uma razao 
F que compara o tamanho da variacao devido 
as nossas manipulates experimentais com o 
tamanho da variacao devido a fatores aleato¬ 
rios, a unica diferenca sendo como calculamos 
essas variancias. Se a variancia, devido a nos¬ 
sas manipulates e grande relativa a variancia 
devido a fatores aleatorios, conseguimos um 
valor alto de F e podemos concluir que os re- 
sultados observados sao pouco provaveis de 
terem aparecido por acaso. 

A Figura 11.1 mostra como a variancia e 
dividida em uma ANOVA de medidas repeti¬ 
das. E importante notar que temos os mesmos 
tipos de variancias que na ANOVA indepen¬ 
dente: temos a soma dos quadrados total (SS X ), 
a soma dos quadrados do modelo (SS M ) e a 
soma dos quadrados residual (SS R ). A unica 
diferenca entre medidas repetidas e a ANOVA 
independente e de onde as somas dos quadra¬ 
dos vem: na ANOVA de medidas repetidas, a 
soma dos quadrados do modelo e a residual 
sao partes da variancia dentre participantes. 
Vamos ver um exemplo. 

Em geral, os estudantes se preocupam 
com a consistencia das notas atribuldas por 
diferentes professores. E comum que os pro- 
fessores tenham reputacao de ser “rfgidos” 
ou “flexiveis” com as notas (ou usando a 
terminologia dos estudantes “manifestacoes 
diabolicas das entranhas de Belzebu” e “boa 
gente”), mas geralmente nao ha provas para 
confirmar a reputacao. Um grupo de estu¬ 
dantes investigou a consistencia das notas 
submetendo os mesmos trabalhos a quatro 
professores diferentes. A nota que cada pro¬ 
fessor atribui a cada trabalho foi registrada 
para cada um de oito trabalhos diferentes. 
Era importante que todos os trabalhos fossem 
avaliados por todos os professores porque 
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Figura 11.1 Partigao da variancia para a ANOVA de medidas repetidas. 


isso eliminava quaisquer diferengas indivi¬ 
duals no padrao da avaliagao do trabalho que 
cada professor pontuou. Esse delineamento e 
de medidas repetidas porque cada professor 
deu uma nota para cada trabalho. A variavel 
independente foi o professor que avaliou o 
trabalho e a variavel dependente foi a nota 
atribulda ao trabalho. 


A Tabela 11.2 mostra os dados para esse 
exemplo. Havia oito trabalhos, cada um ava- 
liado por quatro professores diferentes. As no- 
tas estao apresentadas na tabela. Alem disso, 
a media das notas dadas por cada professor 
e mostrada na tabela e, tambem, a media das 
notas que cada trabalho recebeu e a variancia 
das pontuagoes para um trabalho especifico. 


Tabela 11.2 Dados para o exemplo das notas de trabalhos 


Trabalho 

Professor 1 
(Dr. Field) 

Professor 2 
(Dr. Ferreira) 

Professor 3 
(Dr. Scrote) 

Professor 4 
(Dr. Morte) 

Media 

S 2 

1 

62 

58 

63 

64 

61,75 

6,92 

2 

63 

60 

68 

65 

64,00 

11,33 

3 

65 

61 

72 

65 

65,75 

20,92 

4 

68 

64 

58 

61 

62,75 

18,25 

5 

69 

65 

54 

59 

61,75 

43,58 

6 

71 

67 

65 

50 

63,25 

84,25 

7 

78 

66 

67 

50 

65,25 

132,92 

8 

75 

73 

75 

45 

67,00 

216,00 

Media 

68,875 

64,25 

65,25 

57,375 
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Agora, a variancia total dentre os trabalhos 
ira, em parte, ser causada pelo fato de que pro- 
fessores diferentes sao mais rigidos ou flexf- 
veis na nota (a rnanipula^ao) e ira, em parte, 
ser causada pelo fato de que os proprios tra¬ 
balhos irao diferir em qualidade (difcrencas 
individuais). 


11.3.1 A Soma dos Quadrados Total 
(SS T ) © 



Lembre da ANOVA de 
um fator independente que a 
SS T e calculada usando a se- 
guinte equa^ao (veja a equa¬ 
te (8.4)): 


SS t = s 2 t „JN- 1 ) 


11.3.2 A variacao dentre participantes 
(SS W ) © 

A variagao crucial nesse delineamento e 
que existe um componente da variancia deno- 
minado variancia dentre participantes (ela surge 
porque manipulamos nossa variavel indepen¬ 
dente dentre cada participante). Ela e calcula¬ 
da usando a soma dos quadrados. Em termos 
gerais, quando calculamos qualquer soma de 
quadrados observamos a diferenga ao quadrado 
entre a media e escores individuais. Isso pode 
ser expresso em termos da variancia atraves de 
um numero de escores e o numero de escores 
no qual a variancia e baseada. Por exemplo, 
quando calculamos a soma dos quadrados resi¬ 
dual na ANOVA independente (SS R ) usamos a 
seguinte equagao (veja a equacao (8.7)): 


Nos delineamentos de medidas repetidas, 
a soma dos quadrados total e calculada exa- 
tamente da mesma maneira. A variancia to¬ 
tal na equagao e simplesmente a variancia de 
todos os escores quando ignoramos o grupo 
ao qual eles pertencem. Assim, se tratarmos 
os dados como um grande grupo eles ficarao 
como segue: 


62 

58 

63 

64 

63 

60 

68 

65 

65 

61 

72 

65 

68 

64 

58 

61 

69 

65 

54 

59 

71 

67 

65 

50 

78 

66 

67 

50 

75 

73 

75 

45 


Media Geral = 63,9375 


A variancia desses escores e de 55,028 
(tente fazer isso com a sua calculadora). Usa¬ 
mos 32 escores para gerar esse valor e, assim, 
N 6 32. A equa§ao fica: 

ss T = 4 0ta ,(v- i) 

= 55,028(32- 1) 

= 1705,868 

Os graus de liberdade para essa soma dos 
quadrados, como na ANOVA independente, 
serao N — 1 ou 31. 


SS R — J^( x ik x k ) 

SSr = ^^Sk( n k — 1) 

Essa equa^ao nos da a variancia entre 
indivfduos dentro de um grupo particular e, 
assim, e uma estimativa das diferengas indivi¬ 
duais dentro desse grupo. Portanto, para con- 
seguir o valor total das difcrencas individuais 
temos que calcular a soma dos quadrados den¬ 
tre cada grupo e, entao, soma-las: 

SSr = SQrupol ( n \ ~ 1) + ■ s Grupo2 ( n 2 — 1) 

+ ^Grupo3 («3 - !) 

Isso funciona bem quando temos pessoas 
diferentes em cada grupo, mas em delinea¬ 
mentos de medidas repetidas submetemos as 
pessoas a mais de uma condicao experimental 
e, portanto, estamos interessados na variacao 
nao dentro de um grupo de pessoas (como na 
ANOVA independente), mas em uma so pessoa 
(a variabilidade dos escores de uma mesma pes¬ 
soa). Para descobrir isso usamos, na verdade, 
a mesma equa<jao, mas a adaptamos para pes¬ 
soas e nao grupos. Assim, se chamarmos isso 
de soma dos quadrados SS W (para a SS dentre 
participantes), podemos escreve-la como: 

SS W V’essoalOh 1) “f ,t *Pcssoa2^^2 1) 

“f VessoaSpb 1) ••• “b Veasoa n(^n 1) 
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Essa equagao simplesmente significa que 
estamos observando a variagao nos escores 
dos indivfduos e, entao, acrescentando essas 
variancias para todas as pessoas do estudo. Al- 
guns de voces podem ter notado que, no nosso 
exemplo, estamos usando trabalhos em vez de 
pessoas; para ser detalhista escrevemos assim: 


SS W — * J Trabalhol( ,7 l 1) + i Trabalho2( W 2 1) 
+ > s Trabalho3( H 3 — 1) + 

“b ‘Urabalho/X^n ^ ) 


Os n s simplesmente representam o nu- 
mero de escores nos quais as variancias estao 
baseadas (isto e, o numero de condicbes ex- 
perimentais ou, nesse caso, o numero de pro- 
fessores). Todas as variancias que precisamos 
estao na Tabela 11.2, portanto, podemos cal- 
cular o valor do SS W como: 

SS W = ^Trabalbol( W l — 1) + ■ s TrabaIho2( n 2 — 1) 

+ S Trabalho3( W 3 — 1) + ■ • • 

’ ^ TrabaHion(^n 1) 

= (6,92) (4 — 1) + (11,33) (4-1) 

+ (20,92) (4 - 1) + (18,25) (4 - 1) 

+ (43,58) (4 - 1) + (84,25) (4 - 1) 

+ (132,92) (4- 1) + (216) (4 — 1) 

= 20,76 + 34 + 62,75 + 54,75 
+ 130,75 + 252,75 + 398,75 + 648 

= 1602,5 


Os graus de liberdade para cada pessoa 
sao n - 1 (isto e, o numero de condigoes me- 
nos 1). Para conseguir o total dos graus de 
liberdade somamos o gl para todos os partici- 
pantes. Assim, com oito participantes (traba¬ 
lhos) e quatro condigoes (isto e, n = 4) temos 
8 x 3 = 24 graus de liberdade. 


11.3.3 A Soma dos Quadrados do 
Modelo (SSJ © 

Ate agora sabemos que o total da variagao 
entre os dados e de 1705,868 unidades. Sabe¬ 
mos, tambem, que 1602,5 dessas unidades sao 
explicadas pela variancia criada pelos desem- 
penhos (trabalhos) dos indivfduos sob diferen- 
tes condigoes. Algumas dessas variagoes sao 
resultados da nossa manipulagao experimental 


e algumas sao simplesmente flutuagoes alea- 
torias. O proximo passo e analisar quanta va¬ 
riancia e explicada pela nossa manipulagao e 
quanta variancia nao e explicada. 

Na ANOVA independente, analisamos 
quanta variagao poderia ser explicada pelo 
nosso experimento (o modelo SS) observando 
todas as medias para cada grupo e as compa- 
rando com a media geral. Assim, mensuramos 
a variancia resultante das diferengas entre as 
medias dos grupos e a media geral (veja a 
equagao (8.5)). Fazemos o mesmo com o deli- 
neamento de medidas repetidas. Em primeiro 
lugar, calculamos a media para cada nfvel da 
variavel independente (nesse caso, a media 
das pontuagoes dadas por cada professor) e 
comparamos esses valores com a media total 
de todas as pontuagoes. 

Assim, calculamos esse SS da mesma ma- 
neira do que para a ANOVA independente: 

1. Calcule as diferengas entre as medias para 
cada grupo e a media total. 

2. Eleve ao quadrado cada uma dessas dife¬ 
rengas. 

3. Multiplique cada resultado pelo numero 
de entidades daquele grupo (n t ) 

4. Adicione os valores de cada um dos gru¬ 
pos. 

SS M = ^^n k (x k — x Geral ) 

Usando as medias para os dados dos tra¬ 
balhos (veja a Tabela 11.2), podemos calcular 
oSS M como segue: 

SS M = 8(68,875 - 63,9375) 2 + 8(64,25 
- 63,9375) 2 + 8(65,25 - 63,9375) 2 
+ 8(57,375 - 63,9375) 2 
= 8(4,9375 ) 2 + 8(0,3125) 2 + 8(1,3125) 2 
+ 8(—6,5625) 2 
= 554,125 

Para o SS M os graus de liberdade ( gI M ) sao, 
novamente, 1 a menos do que o numero das 
coisas usadas para calcular essa soma dos qua¬ 
drados. Para a soma dos quadrados do modelo, 
calculamos a soma dos erros ao quadrado entre 
as quatro medias e a media total. Portanto, usa- 
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mos quatro coisas para calcular essas somas dos 
quadrados. Assim, os graus de liberdade serao 
3. Assim como com a ANOVA independente, os 
graus de liberdade do modelo sao sempre iguais 
ao numero de condigoes (k) menos 1: 

glu = k- 1 = 3 

11.3.4 A Soma dos Quadrados dos 
Residuos (SS R ) © 

Sabemos agora que existem 1706 unida- 
des de variagao a serem explicadas nos nos- 
sos dados e que a variacao ao longo de nossas 
condigoes e responsavel por 1602 unidades. 
Dessas 1602 unidades, nossa manipulagao 
experimental pode explicar 554 unidades. A 
soma final dos quadrados e a soma dos qua¬ 
drados dos residuos (SS R ) o que nos diz quan¬ 
ta variacao nao pode ser explicada pelo mo¬ 
delo. Esse valor e a quantidade de variagao 
causada por fatores estranhos fora do contro- 
le experimental (tal como a variacao natural 
na qualidade dos trabalhos). Conhecendo os 
SS W e SS M , a maneira mais simples de cal¬ 
cular o SS R e subtrair o SS M do SS W (SS R = 
SS W — SS M ): 


SS R = ss w - SS M 
= 1602,5 - 554,125 
= 1048,375 


soma dos quadrados (conhecida como media 
dos quadrados, MS) o que simplesmente e a 
soma dos quadrados dividida pelo numero de 
graus de liberdade: 


MS _ SS M 

g M 

SS R 

MS r = —- 
gl R 


554,125 

3 

1048,375 

21 


184,708 
= 49,923 


O MS m representa a quantidade media de 
variacao explicada pelo modelo (por exemplo, 
a variagao sistematica), enquanto o MS R e a 
medida da quantidade media de variagao ex¬ 
plicada pelas variaveis estranhas (a variagao 
nao-sistematica). 


11.3.6 A razao F© 

A razao F e uma medida da razao da va¬ 
riagao explicada pelo modelo e a variagao 
explicada pelos fatores nao-sistematicos. Ela 
pode ser calculada dividindo a media dos 
quadrados do modelo pela media dos qua¬ 
drados dos residuos. Voce deve lembrar que 
isso e exatamente o mesmo para a ANOVA 
independente: 


7?= ms m 

ms r 


Os graus de liberdade sao calculados de 
maneira similar: 

gl r = glw ~ gl M 

= 24-3 
= 21 

11.3.5 A media dos quadrados © 

O SS M nos informa quanta variagao o mo¬ 
delo (por exemplo, a manipulagao experimen¬ 
tal) explica e o SS R nos diz quanta variagao e 
devida a fatores estranhos. Entretanto, porque 
esses dois valores sao valores somados, o nu¬ 
mero de escores somados os influencia. Como 
com a ANOVA independente, eliminamos 
essa tendenciosidade calculando a media da 


Assim, como com a ANOVA independen¬ 
te, a razao F e ainda a razao entre a variagao 
sistematica e a variagao nao-sistematica. Como 
tal, ela e a razao do efeito experimental para o 
efeito no desempenho dos fatores nao-explica- 
dos. Para os dados das notas a razao F e: 

i7 _MS M _ 184,708 _ 3?Q 
MS r 49,923 

Esse valor e maior do que 1, o que indica 
que a manipulagao experimental tern algum 
efeito sobre as notas alem do efeito de fatores 
estranhos. Assim como com a ANOVA inde¬ 
pendente, esse valor pode ser comparado com 
um valor crftico baseado nos seus graus de li¬ 
berdade (gl M e gl R que sao 3 e 21 nesse caso). 
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11.4 ANOVA DE MEDIDAS REPETIDAS DE 
UM FATOR UTILIZANDO 0 SPSS © 

11.4.1 A analise principal © 

Continuando com o exemplo das notas 
dos trabalhos, no Capftulo 2, nos deparamos 
com a regra basica do editor de dados: cada 
linha representa os dados de um dos parti- 
cipantes e cada coluna representa um nfvel 
de uma variavel. Portanto, colunas separadas 
representam rn'veis de uma variavel de medi- 
das repetidas. Assim, nao ha necessidade de 
uma variavel codigo (como nos delineamen- 
tos entre grupos). Os dados estao na Tabela 
11.2 e podem ser digitados no editor de dados 
do SPSS no mesmo formato que estao na ta¬ 
bela (voce nao precisa incluir as colunas de- 
nominadas trabalho, media ou s 2 porque elas 
foram inclufdas somente para esclarecer que 
os professores pontuaram os mesmos traba¬ 
lhos e para ajudar na explicayao de como essa 
ANOVA e calculada). Para comeyar, crie uma 
variavel denominada tutor 1 (professor 1) e 
use a caixa de dialogo labels (rotulos) para 
dar a essa variavel um titulo completo de “Dr. 
Field”. Na proxima coluna, crie uma variavel 
denominada de tutor2 (professor 2) e de a 
essa variavel um tftulo completo de “Dr. Fer¬ 
reira”. Faya o mesmo para criar as variaveis 
restantes denominadas tutor3 e tutor4. Esses 
dados tambem podem ser encontrados no ar- 
quivo TutorMarks.sav. 

Para executar uma ANOVA usando o 
delineamento de medidas repetidas, sele- 
cione a caixa de dialogo define factors (de- 
fina fatores) seguindo o caminho do menu 


Analyze=>General Linear Model=>Repeated 
Measures... (Analisar=>Modelo Linear 
Genera]izado=>Medidas Repetidas...) Na cai¬ 
xa de dialogo define factors (Figura 1 1 .2,) e 
solicitado que voce de um nome para a variavel 
dentre participantes (medidas repetidas). Nes- 
se caso, a variavel de medidas repetidas foi o 
professor que pediu o trabalho, assim, a palavra 
factor 1 (fator 1) deve ser trocada pela palavra 
tutor (professor). O nome que voce der para a 
variavel de medidas repetidas esta restrito a oito 
caracteres. Quando voce tiver dado um nome ao 
fator de medidas repetidas, voce deve dizer ao 
computador quantos niveis havia para aquela 
variavel (isto e, quantas condiyoes experimen¬ 
tal havia). Nesse caso, ha quatro professores, 
assim, temos que entrar com o numero 4 no 
quadro denominado Number of Levels (Nume¬ 
ro de Niveis). Clique em M (Adicionar) para 
acrescentar essa variavel a lista de variaveis de 
medidas repetidas. Essa variavel ira agora apa- 
recer na caixa branca na parte de baixo da caixa 
de dialogo e aparece como tutor(4). Se o seu 
delineamento tem diversas variaveis de sujei- 
tos, voce pode acrescentar mais fatores a lista. 
Quando voce entrou com todos os fatores de 
sujeitos que foram mensurados clique em ■>*»» 
(Definir) para ir a caixa de dialogo principal. 

A caixa de dialogo principal (Figura 
11.3) tem um espayo denominado Within- 
Subjects Variables (variaveis dentre parti¬ 
cipantes) que content uma lista com quatro 
pontos de interrogayao seguidos por um nu¬ 
mero. Esses pontos de interrogayao sao para 
as variaveis representando os quatro niveis da 
variavel independente. As variaveis corres- 



Figura 11 .2 Caixa de dialogo para definir fatores para a ANOVA de medidas repetidas. 
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Figura 11.3 Caixa de dialogo principal para a 
ANOVA de medidas repetidas (antes e apos a 
finalizagao). 


pondentes a esses mveis devem ser seleciona- 
das e colocadas no lugar apropriado. Temos 
somente quatro variaveis no editor de dados, 
assim, e possfvel selecionar todas as quatro 
variaveis de uma vez (clicando na variavel do 
topo, pressionando o mouse e arrastando-o 
sobre das outras variaveis). As variaveis sele- 
cionadas podem ser transferidas clicando em 
jJ. Quando todas as variaveis foram transfe¬ 
ridas, voce pode selecionar varias opcoes para 
a analise. Existent varias opcoes que podem 
ser acessadas com botbes na parte de baixo 
da caixa de dialogo principal. Essas opcoes 
sao semelhantes aquelas que acabamos de 
encontrar. 


11.4.2 Definindo contrastes para 
medidas repetidas © 

Nao e possfvel especificar comparagoes pla- 
nejadas definidas pelo usuario para os delinea- 
mentos de medidas repetidas no SPSS. 1 Entre- 
tanto, existe a opgao de conduzir um dos muitos 
contrastes padrao que vimos anteriormente (veja 
a Segao 9.3.3 para detalhes de como mudar con¬ 
trastes). Se voce clicar em (Contrastes), 
na caixa de dialogo principal, pode acessar a 
caixa de dialogo contrasts (Figura 11.4). O con- 
traste padrao e o polinomial; para mudar esse 
padrao, selecione a variavel no quadro denomi- 
nada Factors (Fatores), clique em zl proximo 
da caixa Contrast, (Contrastes), selecione um 

contraste da lista e clique em . . g (Alterar). Se 

voce escolher realizar um contraste simples, 
pode especificar se voce gostaria de comparar 
os grupos contra a primeira ou a ultima catego- 
ria. A primeira categoria seria aquela que voce 
entrou como (1) na caixa de dialogo e, para es¬ 
ses dados, a ultima categoria seria a que entrou 
como (4). Portanto, a ordem na qual voce entra 
as variaveis na caixa de dialogo principal e im- 
portante para os contrastes que voce escolher. 

Nao existe um contraste particularmen- 
te bom para os dados que temos (o contraste 
simples nao e muito util porque nao temos 
uma categoria de controle), assim, sugiro 
usar o contraste repeated (repetido), que ira 
comparar cada professor com o anterior. Esse 
contraste pode ser util nos delineamentos de 
medidas repetidas nos quais os mveis da va¬ 
riavel independente tern uma ordem signi- 
ficativa. Um exemplo e se voce mensurou a 
variavel dependente em pontos sucessivos no 
tempo ou administrou doses crescentes de um 
remedio. Quando voce tiver selecionado esse 
contraste, clique em c -»-- (Continuar) para re- 
tornar a caixa de dialogo principal. 


1 Na verdade, como mencionei no capitulo anterior, voce 
pode, mas apenas com a sintaxe do SPSS. Aqueles que 
nao estao com vontade de enfiar a cabega numa maquina 
de moer podem ler o arquivo ContrastsUsingSyntax. 
pdf (Contrastes usando a sintaxe) no site www.artmed. 
com.br. Aqueles que estao com vontade de enfiar cabega 
na maquina de moer podem ler o arquivo, tambem: ele 
vai ter o mesmo efeito (pelo menos para mim teve)! 
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Figura 11.4 Contrastes de medidas repetidas. 



11.4.3 Testes post hoc e opcoes 
adicionais ® 

Existem importantes con- 
sideracoes quando pensamos 
em qual teste post hoc iremos 
utilizar. A violacao da esferici- 
dade tem implicates para as 
comparacoes multiplas. Boik (1981) forneceu 
um importante relato dos efeitos da nao-esfe- 
ricidade nos testes post hoc em delineamentos 
de medidas repetidas e concluiu que mesmo 
pequenos desvios da esfericidade produzem 
grande tendenciosidade na estatistica F. Ele 
recomenda usar esses testes para contrastes de 
medidas repetidas. Quando os termos erro ex- 
perimentais sao pequenos, o poder de detectar 
efeitos relativamente fortes pode ser tao baixo 
quanto 0,05 (com a esfericidade = 0,80). Boik 
argumenta que a situacao para compara 9 oes 
multiplas nao pode ser melhorada e conclui 
recomendando a analoga multivariada. Mitzel 
e Games (1981) descobriram que quando a es¬ 
fericidade nao se mantem (e < 1), o erro de 
conjunto convencionalmente empregado em 
comparapbes entre pares resultou em diferen- 
cas nao-significativas entre duas medias de- 
claradas como significativas (isto e, uma taxa 
tolerante de erro Tipo I) ou diferencas nao-de- 
tectadas (uma taxa conservadora de erro Tipo 
I). Mitzel e Games, portanto, recomendaram o 
uso separado dos termos erro para cada corn- 


par acao. Maxwell (1980) testou sistematica- 
mente o poder e rn'veis alfa para cinco testes 
post hoc sob condipoes de medidas repetidas. 
Os testes avaliaram a diferenpa totalmente sig- 
nificativa de Tukey (WSD) que usa o termo 
erro de conjunto; o procedimento de Tukey, 
mas com um erro termo separado ou com (n 
— 1) gl (rotulado de SEP1) ou (n — 1) (k — 1) 
gl (rotulado de SEP2); o procedimento de 
Bonferroni (BON); uma abordagem multiva¬ 
riada - o intervalo de confianpa simultaneo de 
Roy-Bose (SCI). Maxwell testou esses proce- 
dimentos a priori variando o tamanho da 
amostra, o numero de rn'veis do fator repetido 
e o afastamento da esfericidade. Ele descobriu 
que a abordagem multivariada era sempre 
“muito conservadora para usos praticos” (p. 
277) e isso era mais extremo quando n (o nu¬ 
mero de sujeitos) e pequeno em relapao a k (o 
numero das condicoes). O teste de Tukey in- 
flacionou o valor de alfa de forma inaceitavel 
com afastamentos crescentes da esfericidade 
ate mesmo quando um termo erro separado era 
usado (SEP1 e SEP2). O metodo Bonferroni, 
entretanto, foi extremamente robusto (embora 
levemente conservador) e controlava bem os 
nlveis de alfa apesar da manipulacao. Portanto, 
em termos de taxas de erro Tipo I, o teste de 
Bonferroni foi o melhor. 

Em termos de poder de teste (a taxa de 
erro do Tipo II) para uma amostra pequena (n 
= 8), Maxwell descobriu que o WSD e o mais 
poderoso sob as condicoes de nao-esfericida- 
de, mas essa vantagem era muito reduzida 
quando n = 15. Keselman e Keselman (1988) 
estenderam o trabalho de Maxwell para deli¬ 
neamentos nao-balanceados. 
Eles tambem usaram o WSD 
de Tukey, um WSD modifica- 
do (com a variancia do erro 
nao-agrupada), a estatistica t 
de Bonferroni e uma abordagem multivariada 
e descobriram que quando medias nao-ponde- 
radas sao usadas (com delineamentos nao-ba- 
lanceados) nenhum dos quatro testes poderia 
controlar a taxa de erro do Tipo I. Quando me¬ 
dias ponderadas foram usadas, somente os 
testes multivariados podiam limitar as taxas 
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de alfa, embora a estatistica t de Bonferroni 
fosse consideravelmente melhor do que os 
dois metodos de Tukey. Em termos de poder, 
Keselman e Keselman conclufram que “a me- 
dida que o numero dos nfveis das medidas re- 
petidas aumenta, BON e substancialmente 
mais poderoso do que SCI” (p. 223). 

Em resumo, quando a esfericidade e vio- 
lada, o metodo Bonferroni parece, geralmen- 
te, ser a mais robusta das tecnicas univariadas, 
especialmente em termos de poder e controle 
da taxa do erro do Tipo I. Quando a esferici¬ 
dade definitivamente nao for violada, o teste 
de Tukey pode ser usado. Em ambos os casos, 
o procedimento Games-Howell, que utiliza o 
termo erro de conjunto, e preferivel ao teste 
de Tukey. 

Para os leitores que usam as versoes do 
SPSS anteriores a versao 7.0, essa discussao e 
academica, porque esses leitores irao descobrir 
que nao existe facilidade para produzir os tes¬ 
tes post hoc para os delineamentos de medidas 
repetidas nessas versoes! Entao, por que incluf 
essa discussao de quais tecnicas sao as melho- 
res? Bern, para comecar. e possfvel executar a 
analise novamente como um delineamento en- 
tre grupos e usar os procedimentos post hoc. 
Entretanto, como foi dito, muitos procedimen¬ 
tos tem um desempenho ruim com dados rela- 
cionados (especialmente se a esfericidade foi 
violada), assim, eu nao recomendo essa abor- 
dagem. Entretanto, existem arquivos de sintaxe 
dispomveis para a execugao de testes post hoc 
para medidas repetidas (dispomveis em http:// 
www.spss.com/tech/macros/). Dessas macros 
o metodo de Dunn-Sidak e provavelmente o 
melhor porque e menos conservador do que as 
comparagoes corrigidas de Bonferroni. 

Para os leitores que nao tem acesso a in¬ 
ternet ou nao gostam da janela de sintaxe, po- 
demos aplicar as comparagoes de Bonferroni 
usando o procedimento do teste t emparelha- 
do. Realize testes t em todos os pares dos nf- 
veis da variavel independente e, entao, aplique 
a correcao de Bonferroni para a probabilidade 
na qual voce aceita qualquer um desses tes¬ 
tes. Essa corregao e alcangada dividindo o 
valor da probabilidade (0,05) pelo numero de 


testes t realizados. O valor da probabilidade 
resultante deve ser usado como o criterio da 
significancia estatistica. Assim, por exemplo, 
se compararmos todos os nfveis da variavel 
independente dos dados do trabalho, farfamos 
seis comparagoes ao todo, e o nfvel de sig¬ 
nificancia apropriado seria 0,05/6 = 0,0083. 
Portanto, aceitarfamos testes 1 que tenham o 
valor de significancia menor do que 0,0083. 
Uma maneira de recuperar parte do poder des- 
se tipo de procedimento e comparar somente 
grupos entre os quais voce espera que apare- 
9 am diferengas (em vez de comparar todos os 
pares dos nfveis de tratamento). Quanto me¬ 
nos testes voce executar, menos voce tera que 
corrigir o nfvel de significancia e mais poder 
voce ira manter. 

A boa notfcia para as pessoas usando o 
SPSS versao 7.5 ou posteriores e que alguns 
procedimentos post hoc estao dispomveis para 
medidas repetidas. Entretanto, eles nao sao 
acessados pela caixa de dialogo dos testes post 
hoc , mas podem ser encontrados como parte 
das opgSes adicionais. Essas opgoes podem 
ser acessadas clicando em ° pl "™ (Opcoes) na 
caixa de dialogoprincipal para abrir a caixa 
de dialogo medidas repetidas MLG: opcoes 
(veja a Figura 11.5). Para especificar os testes 
post hoc, selecione a variavel de medidas repe¬ 
tidas (nesse caso, tutor (professor)) no quadra 
denominado Estimated Marginal Means: 
Factor(s) and Factor Interactions (Medias 
Marginais Estimadas: Fator(es) e interacdes 
de fatores) e transfira-a para o quadro Dis¬ 
play Means (Exibir Medias) clicando em ID. 
Uma vez que a variavel foi transferida, a caixa 
denominada Compare main effects (Com¬ 
pare efeitos principais) se torna ativa e voce 
deve selecionar essa opgao E camn»»naii.tn«<»s . Se 
essa opcao e selecionada, a caixa denomina¬ 
da Confidence Interval adjustments (Ajus- 
tes do intervalo de confianca) se torna ativa e 
voce pode clicar em z\ para ver a escolha de 
tres nfveis de ajustes. O padrao e nao ter ajus- 
te e, simplesmente, executar o teste post hoc 
LSD de Tukey (isso nao e recomendado). A 
segunda opgao e a corregao de Bonferroni (re- 
comendada pelas razoes mencionadas acima) 
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Repeated Measures: Options 
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Figura 11.5 Caixa de dialogo opgoes. 


e a opcao final e a corregao Sidak que deve 
ser selecionada se voce esta preocupado com 
a perda de poder associada aos valores corri- 
gidos de Bonferroni. 

A caixa de dialogo options (Opgoes) (Fi¬ 
gura 11.5) tem, tambem, outras opgoes uteis. 
Voce pode pedir por estatfsticas descritivas, 
que ira fornecer as medias, desvios padrao e o 
numero de participantes para cada nfvel da va- 
riavel independente. Voce tambem pode solici- 
tar uma matriz de transformagao, que fornece 
os valores de codigo para qualquer contraste 
selecionado na caixa de dialogos contrasts 
(contrastes) (Figura 11.4) e e muito util para 
a interpretagao dos contrastes em delineamen- 
tos mais complexos. O SPSS tambem pode 
ser solicitado a imprimir as hipoteses, erros e 
a soma dos quadrados residual e matrizes do 
produto cruzado (SSCPs) e aprenderemos so- 
bre a importancia dessas matrizes no Capitulo 
14. A opgao para a homogeneidade dos tes¬ 
tes da variancia sera ativada somente quando 
houver um fator entre grupos (delineamentos 
mistos - veja o proximo capitulo). Voce pode, 
tambem, mudar o nfvel de significancia para 
testar qualquer teste post hoc; geralmente, o 
nfvel 0,05 e aceitavel. Depois de selecionar as 


opgoes de interesse, clique em para re- 
tornar a caixa de dialogo principal e clique em 
°* para executar a analise. 

11.5 SAIDAS PARA A ANOVA DE 
MEDIDAS REPETIDAS DE UM 
FATOR © 

11.5.1 Descritivas e outros 
diagnosticos (D 

A Safda 11.1 do SPSS mostra as estatfsticas 
de diagnostico iniciais. Em primeiro lugar elas 
nos informam as variaveis que representam cada 
nfvel da variavel independente. Esse resultado e 
util para verificar que as variaveis foram coloca- 
das na ordem correta. A proxima tabela fornece 
estatfsticas descritivas basicas para os quatro 
nfveis da variavel independente. A partir dessa 
tabela podemos ver que, em media, o Dr. Field 
deu as notas mais altas para os trabalhos (isso 
porque eu sou legal, sabe... ou pode ser porque 
eu sou um estupido e, assim, meus padroes aca- 
demicos sao muito baixos!). O Dr. Morte, por 
outro lado, deu notas muito baixas. Esses valo¬ 
res medios sao uteis para interpretar qualquer 
efeito que possa surgir da analise principal. 
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Saida 11.1 do SPSS 

Within-Subjects Factors 
(Fatores entre participantes) 


Measure: MEASURE_1 (Medida: MEDIDA 1) Descriptive Statistics (Estatisticas Descritivas) 


TUTOR 

(Professor) 

Dependent Variable 
(Variavel Dependente) 



Mean 

(Media) 

Std. Deviation 
(Desvio Padrao) 

N 

i 

TUTOR1 


Dr. Field (Dr. Field) 

68.8750 

5.6426 

8 

2 

TUTOR2 


Dr. Smith (Dr. Ferreira) 

64.2500 

4.7132 

8 

3 

TUTOR3 


Dr. Scrote (Dr. Scrots) 

65.2500 

6.9230 

8 

4 

TUTOR4 


Dr. Death (Dr. Morte) 

57.3750 

7.9091 

8 


11.5.2 Interpretando e corrigindo a 
esfericidade © 

Na Segao 11.2.3, foi afirmado que o SPSS 
testa se os dados violam a hipotese de esferici¬ 
dade. A proxima parte da saida contem infor- 
magoes sobre esse teste. O teste de Mauchly 
nao deve ser significativo se assumirmos que a 
condigao de esfericidade foi satisfeita. A Saida 

11.2 do SPSS mostra o teste de Mauchly para 
as notas dos professores e a coluna importante 
e a que contem o valor da significancia. O va¬ 
lor de significancia (0,043) e menor do que o 
valor critico de 0,05, assim, aceitamos que as 
variancias das diferengas entre os niveis sao 
significativamente diferentes. Em outras pa- 
lavras, a hipotese de esfericidade foi violada. 
Sabendo que violamos essa hipotese a pergun- 
ta pertinente e: como devemos proceder? 

Descobrimos, na Segao 11.2.5, que o SPSS 
produz tres corregdes baseadas nas estimati- 
vas de esfericidade apoiado por Greenhouse e 


Geissser (1959) e Huynh e Feldt (1976). Am- 
bas estimativas fornecem um fator de corregao 
que e aplicado aos graus de liberdade usados 
para determinar a razao F observada. A corre¬ 
gao de Greenhouse e Geiser varia entre \/(k - 
1 ) (onde k 6 o numero de condigoes de medidas 
repetidas) e 1. Quanto mais proximo esse £ esta 
de 1 , 00 , mais homogeneas serao as diferengas 
das variancias e, portanto, mais proximos os 
dados estao de serem esfericos. Numa situagao 
em que existem quatro condigoes (como nos 
nossos dados), o limite mais baixo de e sera 1/ 
(4 - 1) ou 0,33 (conhecido como estimativa li¬ 
mite inferior ( lower-bound) da esfericidade). A 
Saida do SPSS 11.2 mostra que o valor calcula- 
do de £ e 0,558. Isso e mais proximo ao limite 
mais baixo de 0,33 do que o limite superior de 
1 e ele, portanto, representa um desvio subs- 
tancial da esfericidade. Veremos como esses 
valores sao usados na proxima segao. 


Saida do SPSS 11.2 

Mauchly's Test of Sphericity 3 (Teste de Mauchly da Esfericidade) 


Measure: Measure J (Medida: Medida l) 







Epsilon b 

Within-Subjects 
Effect (Efeito dentre 
participantes) 

Mauchly's 1/1/ 
(W de Mauchly) 

Approx. Chi-Square 
(Qui-Quadrado 
Aproximado) 

df 

(gi) 

Sig. 

(Sig.) 

Greenhouse- 

Geisser 

Huynh- 

Feldt 

Lower- 

bound 

(Limite 

Inferior) 

TUTOR (Professor) 

0.131 

11.628 

5 

0.043 

0.558 

0.712 

0.333 


Testa a hipotese nula de que a matriz de covariancia dos erros das variaveis dependentes transformadas e ortonormaliza- 
das e proporcional a uma matriz identidade. 
a Delineamento: Intercepto dentre participantes: TUTOR 

b Pode ser utilizado para ajustar os graus de liberdade dos testes de significancia para medias. Os testes corrigidos sao 
mostrados em camadas (por padrao) na tabela dos testes de efeitos dentre participantes. 
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11.5.3 A ANOVA principal © 

A Saida 11.3 do SPSS mostra os resultados 
da ANOVA para a variavel entre participantes. 
Essa tabela pode ser lida da mesma manei- 
ra que a da ANOVA de um fator entre grupos 
(veja o Capi'tulo 8). Existe uma soma dos qua- 
drados para o efeito de medidas repetidas tutor 
(professor) que nos diz quanto da variabilidade 
total e explicada pelo efeito experimental. Note 
que o valor e 554,125, a soma dos quadrados do 
modelo(SS M ) calculado na secao 11.3.3. Existe 
tambem um termo erro que e a variaeao nao-ex- 
plicada entre as condi§oes da variavel de medi¬ 
das repetidas. Essa e a soma dos quadrados re¬ 
sidual (SS R ) que foi calculada na Segao 11.3.4; 
note que o valor e 1048,375 (que e o mesmo 
valor que foi calculado). Como expliquei ante- 
riormente, essas somas dos quadrados sao con- 
vertidas em medias dos quadrados pela divisao 


pelos graus de liberdade. Como vimos antes, o 
gl para o efeito professor e simplesmente k- 1, 
onde k 6 o numero de ntveis da variavel inde- 
pendente. O gl do erro e (n - 1 )(k - 1), onde n 
e o numero de participantes (ou, nesse caso, o 
numero de trabalhos) e k e como antes. A ra- 
zao F e obtida dividindo a media dos quadra¬ 
dos para o efeito experimental (184,708) pelas 
do erro (49,923). Assim como com a ANOVA 
entre grupos, essa estatfstica representa a ra- 
zao entre a variancia sistematica e a variancia 
nao-sistematica. O valor de F (184,71/49,92 = 
3,70) e, entao, comparado com o valor critico 
para 3 e 21 graus de liberdade. O SPSS mostra 
o valor da signiftcancia exata para a razao F. 
A significancia de F e 0,028, o que e signifi- 
cativa, porque e menor do que o valor critico 
de 0,05. Podemos, portanto, concluir que existe 
uma diferenqa significativa entre as notas dadas 
pelos quatro professores. Entretanto, esse teste 


Saida 11 .3 do SPSS ANOVA de medidas repetidas para as versoes 8.0 e posteriores (tabela 
de cima) e versoes 7.0 e 7.5 (tabela de baixo) 

Tests of Within-Subjects Effects (Testes de efeitos entre participantes) 


Measure: MEASURE _7 (Medida: MEDIDA1) 


Source (Fonte) 

Tipe III Sum of 
Squares (Soma dos 
Quadrados do Tipo III) 

df{ gl) 

Mean Square 
(Media dos 
Quadrados) 

F 

Sig. 

TUTOR 

Sphericity Assumed (Esferici- 

554.125 

3 

184.708 

3.700 

0.028 


dade Assumida) 







Greenhouse-Geisser 

554.125 

1.673 

331.245 

3.700 

0.063 


Huynh-Feldt 

554.125 

2.137 

259.329 

3.700 

0.047 


Lower-bound (Limite-inferior) 

554.125 

1.000 

554.125 

3.700 

0.096 

ErrorfTUTOR) 

Sphericity Assumed (Esferici- 

1048.375 

21 

49.923 



(Tutor(Erro)) 

dade Assumida) 







Greenhouse-Geisser 

1048.375 

11.710 

89.528 




Huynh-Feldt 

1048.375 

14.957 

70.091 




Lower-bound (Limite-inferior) 

1048.375 

7.000 

149.768 




a. Calculado utilizando alfa = 0,05. 


Tests of Within-Subjects Effects (Testes de efeitos entre participantes) 


Measure: MEASUREJ (Medida: MEDIDA1) 
Sphericity Assumed (Esfericidade Assumida) 


Source (Fonte) 

Tipe III Sum of Squares (Soma 
dos Quadrados do Tipo III) 

df 

(gl) 

Mean Square (Media 
dos Quadrados) 

F 

Sig. 

TUTOR 

564.125 

3 

184.708 

3.700 

0.028 

ErrorfTUTOR) (Tutor(Erro)) 

1048.375 

21 

49.923 




a. Calculado utilizando alfa = 0,05. 
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principal nao nos informa quais professores di- 
feriram entre si nas suas notas. 

Embora esse resultado seja bem plausl- 
vel, aprendemos que as violates da hipotese 
da esfericidade tornam o teste F impreciso. 
Sabemos pela Saida 11.2 do SPSS que esses 
dados nao eram esfericos e, assim, precisamos 
levar em consideraqao essa violarjao. A tabela 
na Saida 11.3 do SPSS mostra a razao F e os 
graus de liberdade associados quando a esferi¬ 
cidade e assumida e a estatistica F significativa 
indica diferenga(s) entre as notas dadas pelos 
quatro professores. Em versoes do SPSS pos- 
teriores a 8, essa tabela tambem contem linhas 
adicionais dando os valores corrigidos de F e 
para os tres diferentes tipos de ajustamentos 
(Greenhouse-Geisser, Huynh-Feldt e limite in¬ 
ferior). Nas versoes 7.0 e 7.5 voce deve ajustar 
a tabela da ANOVA para ver esses valores cor¬ 
rigidos. Embora muitas pessoas nao tenham 
essas versoes, vale a pena notar que se voce 
usar o mouse para clicar duas vezes na tabela 
principal da ANOVA, a tabela ira abrir para a 
cdicao e um novo conjunto de rotulos de menu 
deve aparecer no alto da janela. Um desses me¬ 
nus e denominado Pivot. Clique nesse menu e 
selecione a opgao denominada Move Layers 
to Rows (Mova Camadas para Linhas). Os va¬ 
lores de F corrigidos devem aparecer. 

A Saida 11.4 do SPSS mostra a tabela ex- 
pandida da ANOVA com os valores corrigidos 


para cada uma das tres estimativas de esferi¬ 
cidade e ela parece com a tabela das versoes 
mais recentes do SPSS (como na Saida 11.3 
do SPSS). Note que em todos os casos as ra- 
z5es F permanecem as mesmas; sao os graus 
de liberdade que mudam (e, portanto, o valor 
crltico com o qual a estatistica F e comparada). 
Os graus de liberdade foram ajustados usan- 
do as estimativas de esfericidade calculadas 
na Saida 11.2 do SPSS. Os ajustes sao feitos 
multiplicando os graus de liberdade pela es- 
timativa da esfericidade (veja Field, 1998a). 2 
Os novos graus de liberdade sao, entao, usa- 
dos para averiguar a significance de F. Para 
esses dados, as corre^oes resultam no F obser- 
vado sendo nao-significativo quando usada a 
corre^ao de Greenhouse e Geisser (porque p 
> 0,05). Entretanto, foi notado anteriormente 
que essa corre^ao e bem conservadora e, as¬ 
sim, pode perder efeitos que genuinamente 
existem. Ela e, portanto, util para consultar 
a estatistica do F corrigido de Huynh-Feldt. 
Usando essa corre^ao, o valor do F continua 


2 Por exemplo, a estimativa de esfericidade de Greenhou¬ 
se e Geisser era 0,558. Os graus de liberdade originais 
para o modelo eram 3; esse valor e conigido multipli¬ 
cando pela estimativa da esfericidade (3 x 0,558 = 
1,674). Da mesma forma, o gl do erro era 21; esse valor 
e corrigido da mesma maneira (21 x 0,558 = 11,718). 
A razao F e, entao, testada contra o valor crftico com 
esses novos graus de liberdade (1,674, 11,718). As ou- 
tras concedes sao aplicadas da mesma maneira. 


Saida 11.4 do SPSS 

Tests of Within-Subjects Effects (Testes de efeitos dentre participantes) 


Measure 

(Medida) 

Source 

(Fonte) 

Tipe III Sum of 
Squares (Soma 
dos Quadrados 
do Tipo III) 

df (gl) 

Mean 
Square 
(Media dos 
Quadrados) 

F 

Sig. 

MEASURE_ 1 Sphericity Assumed (Es- 
(Medidal) fericidade Assumida) 

TUTOR 

Error(TUTOR) 

554.125 

1048.375 

3 

21 

184.708 

49.923 

3.700 

0.028 

Greenhouse-Geisser 

TUTOR 

Error(TUTOR) 

554.125 

1048.375 

1.673 

11.710 

331.245 

89.528 

3.700 

0.063 

Huynh-Feldt 

TUTOR 

Error(TUTOR) 

554.125 

1048.375 

2.137 

14.957 

259.329 

70.091 

3.700 

0.047 

Lower-bound (Limite- 
inferior) 

TUTOR 

Error(TUTOR) 

554.125 

1048.375 

1.000 

7.000 

554.125 

149.768 

3.700 

0.096 


a. Calculado utilizando alfa = 0,05. 
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significativo porque o valor de probabilidade 
de 0,047 esta abaixo do valor crftico de 0,05. 
Assim, para essa corregao podemos aceitar a 
hipotese de que os professores diferem nas 
suas notas. Entretanto, foi tambem notado que 
essa corregao e bem liberal, assim, tende a 
aceitar valores como significativos quando, na 
realidade, eles nao sao significativos. 

Isso nos deixa num dilema desconcertan- 
te se aceitamos ou nao essa estatlstica F como 
significativa. Mencionei anteriormente que 
Stevens (1992) recomenda tirar a media das 
duas estimativas e, certamente, quando duas 
corregoes dao resultados diferentes (como nes- 
se caso), esse e um conselho sabio. Se as duas 
corregbes dao origem a mesma conclusao, faz 
pouca diferenga qual delas voce escolhe para 
relatar (embora se voce aceitar a estatlstica F 
como significativa e melhor relatar a estimati- 
va conservadora de Greenhouse-Geisser para 
evitar crfticas!). Embora seja facil calcular a 
media dos dois fatores de corregao e corrigir 
os graus de liberdade de modo apropriado, nao 
e tao facil calcular a probabilidade exata para 
esses graus de liberdade. Portanto, se voce ti- 
ver que enfrentar essa situagao (que, para ser 
honesto, e muito improvavel), recomendo tirar 
a media dos dois valores de significancia para 
ter uma ideia aproximada da corregao que esta 
dando a resposta mais precisa. Nesse caso, a 
media dos dois valores de p e (0,063 + 0,047) 
/ 2 = 0,055. Portanto, provavelmente devemos 
usar a corregao de Greenhouse e Geisser e 
concluir que a razao F nao e significativa. 

Os dados ilustram a importancia de usar 
um valor crftico valido de F: ele pode significar 


a diferenga entre um resultado estatisticamente 
significativo e um resultado nao-significativo. 
Mais importante ainda, ele pode significar a 
diferenga entre fazer um erro do Tipo I ou nao. 
Se nao tivessemos usado as corregoes para a 
esfericidade terfamos conclufdo, erroneamen- 
te, que os professores deram notas significati- 
vamente diferentes. Entretanto, devo quantifi- 
car essa afirmagao dizendo que esse exemplo 
tambem destaca quao arbitrario e usar um nfvel 
de significancia de 0,05. Essas duas corregoes 
produzem valores de significancia ligeiramente 
menor ou maior do que 0,05 e, mesmo assim, 
eles nos levam a conclusoes completamente 
opostas! Assim, devemos observar o tamanho 
de efeito para ver se ele e substantivo apesar da 
sua significancia. 

Vimos tambem anteriormente que a op- 
gao final quando voce tern dados que violam 
a esfericidade e usar estatfsticas teste multi- 
variadas porque elas nao fazem essa hipotese 
(veja O’Brien e Kaiser, 1985). A Safda 11.5 do 
SPSS rnostra as estatfsticas teste multivariadas 
para esse exemplo (detalhes dessas estatfsticas 
teste podem ser encontrados na Segao 14.3.4). 
A coluna exibindo os valores de significancia 
claramente rnostra que os testes multivariados 
nao sao significativos (porque p e 0,063, o que 
e maior do que o valor crftico de 0,05). Tendo 
em mente a perda do poder nesses testes (veja 
a Segao 11.2.5), esse resultado suporta a deci- 
sao de aceitar a hipotese nula e conclui que nao 
ha diferengas significativas entre as pontuagoes 
dadas por diferentes professores. A interpreta- 
gao desses resultados deveria parar agora por¬ 
que os efeitos principals nao sao significativos. 


Safda do SPSS 11.5 


Multivariate Tests a (Testes Multivariados) 


Effect 

(Efeito) 


Value 

(Valor) 

F 

Hypothesis df 
(gl da Hipotese) 

Error df (gl 
do Erro) 

Sig. 

(Sig.) 

TUTOR 

PiUai's Trace (Tra$o de Pillai) 

0.741 

4.760 3 

3.000 

5.000 

0.063 

(Professor) 

Wilks' Lambda (Lambda de Wilks) 

0.259 

4.760 a 

3.000 

5.000 

0.063 


Hotelling's Trace (Trago de Hotelling) 

2.856 

4.760 a 

3.000 

5.000 

0.063 


Roy's Largest Root (Maior Raiz de Roy) 

2.856 

4.760 a 

3.000 

5.000 

0.063 


a. Delineamento: Intercepto Dentre Participantes: Professor. 

b. Calculado utilizando alfa = 0,05. 

c. Estatlstica exata. 











Descobrindo a EstatIstica Usaimdo o SPSS 413 


Entretanto, iremos observar a safda para os 
contrastes para ilustrar como esses testes estao 
apresentados no visualizador do SPSS. 

11.5.4 Contrastes© 

A matriz de transformagao solicitada nas 
opines e apresentada na Safda 11.6 do SPSS e 
precisamos lembrar como esquematizamos os 
contrastes (veja o Capftulo 8) para interpretar 
essa tabela. Primeiro, deve-se lembrar que um 
codigo 0 significa que o grupo nao esta inclufdo 
num contraste. Portanto, contraste 1 (denomi- 
nado Level 1 vs. Level 2 (Nivel 1 vs. Nfvel 2)) 
ignora o Dr. Scrote e o Dr. Morte. A proxima 
coisa a ser lembrada e que os grupos com uma 
ponderagao negativa sao comparados aos gru¬ 
pos com uma ponderagao positiva. Nesse caso, 
significa que o primeiro contraste compara o 
Dr. Field com o Dr. Ferreira. Usando a mesma 
logica, o contraste 2 (denominado Level 2 vs. 
Level 3 (Nfvel 2 vs. Nfvel 3)) ignora o Dr. Field 
e o Dr. Morte e compara o Dr. Ferreira com o 
Dr. Scrote. Finalmente, o contraste tres (Level 
3 vs. Level 4 (Nfvel 3 vs. Nfvel 4)) compara 
o Dr. Morte com o Dr. Scrote. Esse padrao de 
contrastes e consistente com o que esperamos 
conseguir dos contrastes repetidos (isto e, to- 
dos os grupos, com excegao do primeiro, sao 


Saida do SPSS 11.6 

TUTOR 1 (Professor) 

Measure: MEASURE 1 (Medida: MEDIDA l) 



TUTOR (Professor) 

Dependent 

Variable 

(Variavel 

Dependente) 

Level 1 
vs. Level 

2 (Nivel 1 
vs. Nivel 2) 

Level 2 
vs. Level 

3 (Nivel 2 
vs. Nivel 3) 

Level 3 
vs. Level 

4 (Nivel 3 
vs. Nivel 4) 

Dr. Field (Dr. 
Field) 

1 

0 

0 

Dr. Smith (Dr. 
Ferreira) 

-1 

1 

0 

Dr. Scrote (Dr. 
Scrote) 

0 

-1 

1 

Dr. Death (Dr. 
Morte) 

0 

0 

-1 


a. Os contrastes para os fatores dentre participantes sao: 
Professor: Contraste repetido. 


comparados com a categoria precedente). A 
matriz de transformagao, que aparece na parte 
de baixo da safda, e usada principalmente para 
confirmar o que cada contraste representa. 

Acima da matriz de transformagao, deve- 
mos encontrar uma tabela resumo dos contrastes 
(Safda 11.7 do SPSS). Cada contraste esta lista- 
do por sua vez e, como com os contrastes entre 
grupos, um teste F e realizado comparando as 
duas partes da variagao. Assim, observando os 
valores de significancia da tabela, podemos di- 


Saicla 11.7 do SPSS 


Tests of Within-Subjects Contrasts (Testes dos contrastes dentre participantes) 

Measure: MEASUREJ (Medida: MEDIDA l) 






Mean 





Tipe III Sum of 


Square 



Source 


Squares (Soma dos 

df 

(Media dos 



(Fonte) 

TUTOR (professor) 

Quadrados do Tipo III) 

(gi) 

Quadrados) 

F 

Sig. 

TUTOR 

Level 1 vs. Level2 (Nivel 1 

171.125 

1 

171.125 

18.184 

0.004 


us. Nfvel 2) 

Level2 vs. Level 3 (Nfvel 2 

8.000 

1 

8.000 

0.152 

0.708 


us. Nfvel 3) 

Level 3 vs. Level 4 (Nfvel 3 
vs. Nfvel 4) 

496.125 

1 

496.125 

3.436 

0.106 

Error(TUTOR) 

Level 1 vs. Level2 (Nivel 1 

65.875 

7 

9.411 




us. Nfvel 2) 

Level2 vs. Level3 (Nfvel 2 

368.000 

7 

52.571 




vs. Nfvel 3) 

Level 3 vs. Level 4 (Nfvel 3 
vs. Nfvel 4) 

1010.875 

7 

144.411 
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zer o Dr. Field atribuiu notas significativamente 
mais altas do que o Dr. Ferreira (Level 1 vs. Le¬ 
vel 2), e as notas do Dr. Scrote foram proximos 
as do Dr. Morte (Level 3 vs. Level 4). Entre¬ 
tanto, o contraste significativo deve ser ignorado 
por causa do efeito principal nao-significativo 
(lembre-se de que os dados nao obedecem a es- 
fericidade). Um ponto importante a ser notado e 
que a esfericidade nos nossos dados nos levou a 
algumas questoes importantes sobre a corregao 
dos fatores e sobre aplicagao de algum discer- 
nimento nos seus dados (e reconfortante saber 
que o computador nao tern todas as respostas 
- mas isso significa que temos que, realmente, 
saber algumas das respostas). Nesse exemplo, 
teriamos que concluir que existem diferengas 
nao-significativas entre as notas dadas por di- 
ferentes professores. Entretanto, a ambiguidade 
dos nossos dados pode nos fazer considerar a 
execugao de um estudo similar com um numero 
maior de trabalhos sendo avaliados. 

11.5.5 Testes post hoc © 

Se voce selecionou os testes post hoc 
para a variavel de medidas repetidas na cai- 
xa de dialogo options (opgoes) (veja a Segao 


11.4.3), a tabela Saida 11.8 do SPSS sera 
apresentada na janela visualizadora. 

A disposigao da tabela na Saida 11.8 do 
SPSS e similar a da tabela produzida para os 
testes post hoc entre grupos: as medias das 
diferengas entre grupos sao exibidas assim 
como o erro padrao, o valor de significance 
e o intervalo de confianga para a diferenga en¬ 
tre as medias. Observando os valores de sig¬ 
nificancia podemos ver que a unica diferenga 
entre as medias do grupo e entre o Dr. Field e 
o Dr. Ferreira. Observando as medias desses 
grupos (Saida 11.1 do SPSS), podemos ver 
que eu dou notas mais altas do que o Dr. Fer¬ 
reira. Entretanto, existe um resultado um tanto 
anomalo nisso, pois nao existe diferenga sig- 
nificativa entre as notas dadas pelo Dr. Morte 
e as minhas, embora a diferenga da media en¬ 
tre as pontuagoes seja mais alta (11,5) do que 
a diferenga entre mim e o Dr. Ferreira (4,6). 
A razao desse resultado e a esfericidade nos 
dados. Voce pode considerar a execugao de 
algumas correlagoes entre as notas dos quatro 
professores. Voce ira descobrir que existe uma 
correlagao positiva bem alta entre as pontua¬ 
goes dadas pelo Dr. Ferreira e eu (indicando 


Saida 11.8 do SPSS 


Pairwise Comparisons (Comparagoes aos pares) 


Measure: MEASUREJ (Medida: MEDIDA1) 


(!) TUTOR (j) TUTOR 

Mean 

Difference (I 
-J) (Diferenga 
Media) 

Std. Error 
(Erro Padrao) 

Sig. a 

95% Confidence Interval for Difference 
(Intervalo de 95% de Confianga para a Diferenga) 

Lower Bound 
(Limite Inferior) 

Upper Bound 
(Limite Superior) 

1 2 

4.625* 

1.085 

0.022 

0.682 

8.568 

3 

3.625 

2.841 

1.000 

-6.703 

13.953 

4 

11.500 

4.675 

0.261 

-5.498 

28.498 

2 1 

-4.625* 

1.085 

0.022 

-8.568 

-0.682 

3 

-1.000 

2.563 

1.000 

-10.320 

8.320 

4 

6.875 

4.377 

0.961 

-9.039 

22.789 

3 1 

-3.625 

2.841 

1.000 

-13.953 

6.703 

2 

1.000 

2.563 

1.000 

-8.320 

10.320 

4 

7.875 

4.249 

0.637 

-7.572 

23.322 

4 1 

-11.500 

4.675 

0.261 

-28.498 

5.498 

2 

-6.875 

4.377 

0.961 

-22.789 

9.039 

3 

-7.875 

4.249 

0.637 

-23.322 

7.572 


Baseando nas medias marginais estimadas. 

* A diferenga media e significativa ao nfvel de 0,05. 
a. Ajuste para comparagoes multiplas: Bonferroni. 
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Dica da Samanta Ferrinho 


A 



V. 


• A ANOVA de medidas repetidas de um fator compara varias medias quando 
essas medias vieram dos mesmos participantes; por exemplo, se voce men- 
surou a habilidade estatistica das pessoas a cada mes durante um ano. 

• Na ANOVA de medidas repetidas, ha uma hipotese adicional: a esfericidade. 

Ela precisa ser considerada somente quando voce tern tres ou mais condi- 
goes de medidas repetidas. Teste a esfericidade usando o teste de Mauchly. 
Encontre a tabela com essa denominagao: se o valor na coluna denominada 
Sig. e menor do que 0,05, a hipotese foi violada. Se a significance do teste de 
Mauchly e maior do que 0,05, a hipotese de esfericidade foi confirmada. 

• A tabela denominada Tests of Whithin-Subjects Effects (Testes dos Efeitos 
dentre Sujeitos) mostra o resultado principal para nossa ANOVA. Se a hipo¬ 
tese de esfericidade foi confirmada, observe a linha denominada Sphericity 
Assumed (Esfericidade Assumida). Se a hipotese foi violada, leia a linha de¬ 
nominada Greenhouse-Geisser (voce pode tambem olhar em Huynh-Feldt, 
mas voce deve ler este capitulo para descobrir as vantagens dos dois pro- 
cedimentos). Tendo selecionado a linha apropriada, observe a coluna deno¬ 
minada Sig.: se o valor for menor do que 0,05, as medias dos grupos sao 
significativamente diferentes. 

• Para contrastes e testes post hoc, novamente, observe as colunas denomina- 
das Sig. para descobrir se suas comparagoes sao significantes (elas serao se 
o valor de significance for menor do que 0,05). 

___ J 


um rn'vel baixo de variabilidade nos nossos 
dados). Contudo, existe uma corrclagao bai- 
xa entre as notas dadas pelo Dr. Morte e por 
mim (indicando um alto mvel de variabilidade 
entre nossas pontua 9 oes). E essa grande varia¬ 
bilidade entre o Dr. Morte e eu que produziu 
o resultado nao-significativo, apesar da media 
das notas ser muito diferente (essa observa 9 ao 
e tambem evidente a partir dos erros padrao). 


11.6 TAMANHO DE EFEIT0 PARA ANOVA 
DE MEDIDAS REPETIDAS (D 

Como com a ANOVA in- 
dependente, a melhor medida 
para o tamanho de efeito total 
e o omega ao quadrado (or). 
Contudo, so para tornar a vida 
mais complicada do que ja e, as equa 9 oes 
que anteriormente usamos para o omega ao 
quadrado nao podem ser usadas para os da¬ 
dos de medidas repetidas! Mas se voce real- 
mente usar as mesmas equa 9 oes nos dados 
de medidas repetidas ira superestimar leve- 



mente o tamanho de efeito. Para simplificar, 
algumas pessoas usam a mesma equa 9 ao 
para a ANOVA de um fator independente e 
para a de medidas repetidas (e eu sou culpa- 
do disso em outro livro), mas acho que neste 
livro nos nao vamos optar pela simplicidade, 
mas vamos agarrar a complexidade como se 
fosse nosso irmao gemeo separado de nos 
por muitos anos. 

Na ANOVA de medidas repetidas, a equa- 
9 ao para omega ao quadrado e (segurem-se 
firme...): 

m 2 _ [^(MS m -MS r )] 

MSr + +[ k 4 ( ms m - ms r )] 

( 11 . 1 ) 

OK, isso parece infernal, e e. Mas vamos 
examina-la. Primeiro, existem algumas medias 
dos quadrados que ja vimos (e calculamos) an¬ 
tes. Existe o quadrado medio para o modelo 
(MS m ) e quadrado medio residual (MS R ) e am- 
bos podem ser obtidos da tabela da ANOVA 
que o SPSS produz (Saida 11.3 do SPSS). Tern 
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tambem o k, o numero de condigoes no experi- 
mento, que para esses dados seria 4 (sao quatro 
professores) e ha n, o numero de participantes 
(nesse caso, o numero de trabalhos, 8). O pro- 
blema principal e o termo MS BG . No comego 
da Segao 11.3 (Figura 11.1), mencionei que a 
variagao total e dividida em uma variagao en- 
tre participantes e uma variagao entre grupos. 
Em todos os calculos subsequentes, a variagao 
entre grupos ficou um pouco esquecida (por- 
que nos, na verdade, nao precisamos calcular 
a razao F). Agora ela aparece na equagao do 
omega ao quadrado. A maneira mais facil de 
calcular esse termo e pela subtragao, porque 
sabemos pela Figura 11.1 que: 

SS T = SS BG + ss w 

Agora, o SPSS nao nos fornece o SS W na 
safda, mas nos sabemos que ele e formado 
pelo SS M e pelo SS R que foram dados. Subs- 
tituindo esses termos e reorganizando essa 
equagao, temos: 

SS T = SS BG + SS M + SS R 
SS BG = SS T — SS M — SS R 

O proximo problema e que o SPSS, que 
claramente esta tentando nos atrapalhar a cada 
passo, nao nos fornece o SS T e eu receio (a 
nao ser que eu nao o tenha visto) que voce ira 
precisar calcular manualmente (veja a Segao 
11.3.1). Dos valores que calculamos anterior- 
mente, temos: 


SS BG = 1705,868 - 554,125 - 1048,375 
= 103,37 


O proximo passo e converter isso em um 
quadrado medio dividindo os graus de liberda- 
de que, nesse caso, sao os numeros de pessoas 
no experimento menos 1 (n — 1): 


MS bg = 


SSbg 

BG 


SSbo 
n — 1 


_ 103,37 
8-1 
= 14,77 


Tendo feito tudo isso, e provavelmente 
morto de tedio nesse processo, devemos agora 
ressurgir com renovado vigor para a equagao 
do tamanho de efeito, que fica: 

m 2_ [£(184,71 — 49,92)] 

49,92 + 14 ' 7 7 9 - 92 +[^(184,71 — 49,92)] 
_ 12,64 
_ 53,77 
= 0,24 


Assim, temos um omega ao quadrado de 
0,24. Se voce calcula-lo da mesma maneira 
que a ANOVA independente (veja a Segao 
8.5), deve ter uma resposta ligeiramente maior 
(0,25, na verdade). 



Mencionei em outras opor- 
tunidades que e mais util ter 
medidas do tamanho de efeito 
para comparagoes focadas (em 
vez da ANOVA principal) e, as¬ 
sim, uma abordagem um pouco mais facil para 
calcular os tamanhos de efeito e calcula-los 
para o contraste que ftzemos (veja a Safda 11.7 
do SPSS). Para isso, podemos usar a equagao 
que vimos antes para converter os valores de F 
(porque todos eles tem 1 grau de liberdade para 
o modelo) para r. 


r = 


P(X,gl R ) 

F(lgl R ) + gl R 


Para as tres comparagoes que fizemos, va- 
mos ter: 


O ield v5. Ferreira 


^Ferreira ia. Scrote 


Oicrote vs. Morte 

Portanto, as diferengas entre os Drs. Field 
e Ferreira, e Scrote e Morte eram, ambas, efei- 
tos grandes, mas as diferengas entre os Drs. 
Ferreira e Scrote eram pequenas. 


18,18 
18,18 + 7 

0,15 

0,15+7 “ 
3,44 

3,44 + 7 “ 


0,85 


0,14 


0,57 
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11.7 RELATANDO A ANOVA DE MEDIDAS 
REPETIDAS COM UM FATOR © 

Quando relatamos a ANOVA de medidas 
repetidas, apresentamos os mesmos detalhes 
do que com a ANOVA independente. O uni- 
co fator adicional que devemos nos preocupar 
e relatar os graus de liberdade corrigidos se 
a esfericidade foi violada. Pessoalmente, eu 
tambem gosto de relatar os resultados dos 
testes da esfericidade. Assim como a ANOVA 
independente, os graus de liberdade usados 
para avaliar a razao F sao os graus de liberda¬ 
de para o efeito do modelo ( gl M = 1,67) e os 
graus de liberdade para o resfduo do modelo 
(gl R = 11,71). Lembre que, nesse exemplo, 
nos corrigimos ambos usando a correcao das 
estimativas da esfericidade de Greenhouse e 
Geisser. Portanto, podemos relatar as princi¬ 
pals descobertas como: 

•/ Os resultados mostram que a nota de um 
trabalho nao foi significativamente afeta- 
da pelo professor que adeuF(l,67, 11,71) 
= 3,70, p> 0,05. 

Se voce preferir escolher relatar o teste de 
esfericidade, voce deve relatar a aproximagao 
do qui-quadrado, seus graus de liberdade e o 
seu valor de significance. E bom, tambem, re¬ 
latar o grau de esfericidade com o valor do ep¬ 
silon. Iremos, igualmente, relatar o tamanho 
de efeito na versao melhorada: 

•/ O teste de Mauchly indicou que a hipo- 
tese de esfericidade foi violada (x 2 (5) = 
11,63, p < 0,05); portanto, os graus de 
liberdade foram corrigidos usando as es¬ 
timativas de esfericidade de Greenhouse 
e Geisser (e = 0,56). Os resultados mos¬ 
tram que a nota de um trabalho nao era 
significativamente afetada pelo profes¬ 
sor que a deu F( 1,67, 11,71) = 3,70, p > 
0,05, co 2 = 0,24. 

Lembre que em virtude de a ANOVA nao 
ser significativa, nao devemos relatar qualquer 
analise posterior. 


11.8 MEDIDAS REPETIDAS COM VARIAS 
VARIAVEIS INDEPENDEIMTES © 

Ja vimos que delineamentos simples entre 
grupos podem ser estendidos para incorpo- 
rar uma segunda (ou terceira) variavel inde¬ 
pendente. E igualmente facil incorporar uma 
segunda, terceira ou ate mesmo uma quarta 
variavel independente em uma analise de me¬ 
didas repetidas. Como um exemplo, alguns 
cientistas sociais foram solicitados a pesquisar 
se as imagens poderiam influenciar atitudes 
piiblicas em relagao ao alcool. Existem eviden- 
cias de que atitudes em relagao a estimulos po¬ 
dem ser mudadas usando imagens positivas e 
negativas (por exemplo, Stuart, Shimp e Engle, 
1987; mas veja Field e Davey, 1999) e esses 
pesquisadores estavam interessados em res¬ 
ponder duas perguntas. Por um lado, o governo 
os financiou para observar se imagens negati¬ 
vas em propagandas poderiam ser usadas para 
mudar atitudes em relagao ao alcool. Por ou- 
tro lado, uma companhia de alcool patrocinou 
uma pesquisa para ver se imagens positivas 
poderiam ser usadas para melhorar as atitudes 
em relagao ao alcool. Os cientistas projetaram 
um estudo para abranger ambas as questoes. A 
Tabela 11.3 ilustra o delineamento experimen¬ 
tal e contem os dados para esse exemplo (cada 
linha representa um unico participante). 

Os participantes assistiram um total de 
nove anuncios fictfcios em tres sessoes. Em 
uma sessao eles assistiram tres anuncios: (1) 
uma marca de cerveja (Brain Death) apresen- 
tada com uma imagem negativa (um cadaver 
com o slogan “beber Brain Death faz o seu 
flgado explodir”); (2) uma marca de vinho 
(Dangleberry) apresentada num contexto de 
uma imagem positiva (um homem ou uma 
mulher sexy nus - dependendo do genero do 
participante - e o slogan “beber vinho Dan¬ 
gleberry o torna um garanhao tesudo”) e (3) 
uma marca de agua (Puritan) apresentada com 
uma imagem neutra (uma pessoa assistindo 
televisao acompanhada pelo slogan “beber a 
agua Puritan faz voce ter um comportamen- 
to completamente normal”). Numa segunda 
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sessao (uma semana depois), os participan- 
tes viram as mesmas tres marcas, mas dessa 
vez Brain Death estava acompanhada pela 
imagem positiva, Dangleberry pela imagem 
neutra e Puritan pela imagem negativa. Numa 
terceira sessao, os participantes viram Brain 
Death acompanhada pela imagem neutra, 
Dangleberry pela imagem negativa e Puritan 
pela positiva. Apos cada anuncio foi pedido 
aos participantes para avaliar as bebidas numa 
escala variando de - 100 (detesto) passando 
por 0 (neutro) a 100 (gosto muito). A ordem 
dos comerciais foi aleatoria assim como a or¬ 
dem na qual as pessoas participaram das tres 
sessoes. Esse delineamento e bem complexo. 
Existem duas variaveis independentes: o tipo 
de bebida (cerveja, vinho ou agua) e o tipo de 
imagem usado (positiva, negativa ou neutra). 
Essas duas variaveis se cruzam completamen- 
te produzindo nove condigoes experimentais. 


11.8.1 A analise principal © 

Para entrar com esses dados no SPSS, 
precisamos recapitular a regra basica do edi¬ 
tor de dados, que declara que cada linha re- 
presenta os dados de um unico participante. 
Se a pessoa participa em todas as condigoes 
experimentais (nesse caso eles assistem todos 
os tipos de estimulos com todos os tipos de 
imagens), cada condicao experimental deve 
ser representada por uma coluna no editor 
de dados. Nesse experimento existem nove 
condigoes experimentais, assim, os dados 
precisam entrar em nove colunas (o formato 
e identico ao da Tabela 11.3). Voce deve criar 
as nove variaveis seguintes no editor de dados 
com os nomes como foi dado. Para cada uma 
voce deve, tambem, entrar com uma variavel 
com um nome completo (veja a Segao 2.4.2) 
para clareza na saida. 


Tabela 11.3 Dados de Attitude.sav 


Bebida 


Cerveja 



Vinho 



Agua 


Imagem 

ve + 

ve- 

Neutro 

ve + 

ve- 

Neutro 

ve + 

ve- 

Neutro 


1 

6 

5 

38 

-5 

4 

10 

-14 

-2 


43 

30 

8 

20 

-12 

4 

9 

-10 

-13 


15 

15 

12 

20 

-15 

6 

6 

-16 

1 


40 

30 

19 

28 

-4 

0 

20 

-10 

2 


8 

12 

8 

11 

-2 

6 

27 

5 

-5 

Homem 


17 

17 

15 

17 

-6 

6 

9 

-6 

-13 


30 

21 

21 

15 

-2 

16 

19 

-20 

3 


34 

23 

28 

27 

-7 

7 

12 

-12 

2 


34 

20 

26 

24 

-10 

12 

12 

-9 

4 


26 

27 

27 

23 

-15 

14 

21 

-6 

0 


1 

-19 

-10 

28 

-13 

13 

33 

-2 

9 


7 

-18 

6 

26 

-16 

19 

23 

-17 

5 


22 

-8 

4 

34 

-23 

14 

21 

-19 

0 


30 

-6 

3 

32 

-22 

21 

17 

-11 

4 


40 

-6 

0 

24 

-9 

19 

15 

-10 

2 

Mulher 


15 

-9 

4 

29 

-18 

7 

13 

-17 

8 


20 

-17 

9 

30 

-17 

12 

16 

-4 

10 


9 

-12 

-5 

24 

-15 

18 

17 

-4 

8 


14 

-11 

7 

34 

-14 

20 

19 

-1 

12 


15 

-6 

13 

23 

-15 

15 

29 

-1 

10 
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beerpos 

Cerveja 

+ 

Pessoa sexy 

beerneg 

Cerveja 

+ 

Cadaver 

beerneut 

Cerveja 

+ 

Pessoa sentada 

winepos 

Vinho 

+ 

Pessoa sexy 

wineneg 

Vinho 

+ 

Cadaver 

wineneut 

Vinho 

+ 

Pessoa sentada 

waterpos 

Agua 

+ 

Pessoa sexy 

waterneg 

Agua 

+ 

Cadaver 

waterneu 

Agua 

+ 

Pessoa sentada 


Depois que essas variaveis foram cria- 
das, entre com os dados como na Tabela 11.3. 
Se voce tiver problemas com a entrada dos 
dados, use o arquivo Attitude.sav. Para aces- 
sar a caixa de dialogo Define factors (Defi- 
nir fatores) use o menu Analyze=>General 
Linear Model=>Repeated Measures... 
(Analise=>Modelo Linear Geral=>Medidas Re- 
petidas...). Na caixa de dialogo Define factors, 
voce e solicitado a fornecer um nome para a va¬ 
riavel entre sujeitos (medidas repetidas). Nesse 
caso, existem dois fatores dentre sujeitos: drink 
(bebida) (cerveja, vinho ou agua) e imagery 
(imagem) (positiva, negativa e neutra). Troque 
a palavra factor 1 pela palavra drink (bebida). 
Quando voce tiver dado um nome a esse fator 
de medidas repetidas, deve dizer ao computa- 
dor quantos nfveis a variavel apresenta. Nesse 
caso, ha tres tipos de bebidas, assim, temos que 
entrar com o numero tres no espago denomi- 


nado Number of Levels (Numero de nfveis). 
Clique em *** (Adicionar) para acrescentar 
essa variavel a lista de variaveis de medidas 
repetidas. Essa variavel ira agora aparecer no 
quadro em branco na parte de baixo da caixa de 
dialogo e aparecera como drink (bebida) (3). 
Temos, agora, que repetir esse processo para 
a segunda variavel independente. Entre com 
a palavra imagery (imagem) no espaco deno- 
minado Within-Subject Factor Name (Nome 
do fator entre sujeitos) e, entao, porque ha tres 
nfveis dessa variavel, entre com o numero 3 no 
espaco denominado Number of Levels (Nu¬ 
mero de Nfveis). Clique em ** (Adicionar) 
para incluir essa variavel na lista dos fatores; 
ela ira aparecer como imagery (3) (imagem). 
A caixa de dialogo final e mostrada na Figura 
11.6. Quando voce tiver entrado com ambos os 
fatores dentre sujeitos clique em (Definir) 
a fim de ir para a caixa de dialogo principal. 

A caixa de dialogo principal e essencial- 
mente a mesma do que quando existe somente 
uma variavel independente, com excessao de 
que existem agora nove pontos de interroga¬ 
te (Figura 11.7). No topo da caixa Within 
Subjects Variables (Variaveis entre sujei¬ 
tos), o SPSS declara que existem dois fatores: 
drink e imagery. Na caixa abaixo existe uma 
serie de pontos de interrogates seguidos por 



Figura 11 .6 Caixa de dialogo Define factors (Definir fatores) para a ANOVA fatorial de medidas 
repetidas. 
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Figura 11.7 Caixa de dialogo principal para a ANOVA de medidas repetidas (antes e apos a 
finalizagao). 


numeros entre parenteses. Os numeros nos 
parenteses representam os nfveis dos fatores 
(variaveis independentes): 


_?_(1.1) 

Variavel representando o nivel 1 de bebida 
(drink) e o nivel 1 de imagem (imagery) 

_?_(1.2) 

Variavel representando o nivel 1 de bebida 
(drink) e o nivel 2 de imagem (imagery) 

_?_(1,3) 

Variavel representando o nivel 1 de bebida 
(drink) e o nivel 3 de imagem (imagery) 

_?_(2, 1) 

Variavel representando o nivel 2 de bebida 
(drink) e o nivel 1 de imagem (imagery) 

_?_(2, 2) 

Variavel representando o nivel 2 de bebida 
(drink) e o nivel 2 de imagem (imagery) 

_?_(2, 3) 

Variavel representando o nivel 2 de bebida 
(drink) e o nivel 3 de imagem (imagery) 

_?_(3,1) 

Variavel representando o nivel 3 de bebida 
(drink) e o nivel 1 de imagem (imagery) 

_?_(3, 2) 

Variavel representando o nivel 3 de bebida 
(drink) e o nivel 2 de imagem (imagery) 

_?_(3, 3) 

Variavel representando o nivel 3 de bebida 
(drink) e o nivel 3 de imagem (imagery) 


Nesse exemplo, existem duas variaveis 
independentes e, assim, existem dois nume¬ 
ros nos parenteses. O primeiro numero se re- 
fere aos nfveis do primeiro fator listado acima 
do quadro (nesse caso, drink). O segundo 
numero nos parenteses se refere aos nfveis do 


segundo fator listado acima do quadro (nesse 
caso, imagery). Assim como com a ANOVA 
independente de medidas repetidas, voce e 
solicitado a substituir esses pontos de interro- 
gagao pelas variaveis da lista do lado esquer- 
do da caixa de dialogo. Com delineamentos 
entre grupos, em que codigos de variaveis sao 
utilizados, os nfveis de um fator particular sao 
especificados pelos codigos designados a eles 
no editor de dados. Entretanto, em delinea¬ 
mentos de medidas repetidas, esse codigo nao 
e usado e, assim, determinamos quais condi- 
goes devemos atribuir a um determinado nf- 
vel. Por exemplo, se entrarmos com beerpos 
na lista primeiro, o SPSS ira tratar a cerveja 
como o primeiro nfvel de drink e imagem po- 
sitiva como o primeiro nfvel da variavel ima¬ 
gery. Entretanto, se entrarmos primeiro com 
wineneg na lista, o SPSS ira considerar o vi- 
nho como o primeiro nfvel de drink e imagem 
negativa como o primeiro nfvel de imagery. 
Por essa razao, e imperativo que pensemos 
sobre o tipo de contrastes que queremos fazer 
antes de entrar com as variaveis nessa caixa 
de dialogo. Nesse delineamento, se obser- 
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varmos a primeira variavel, drink, existiam 
tres condigSes, duas das quais envolvem be- 
bidas alcoolicas. De certo modo, a condigao 
da agua age como urn controle para ver se os 
efeitos da imagem sao especfficos ao alcool. 
Portanto, para essa variavel vamos comparar 
as condigoes da cerveja e do vinho com a con¬ 
digao da agua. Essa comparagao pode ser fei- 
ta especificando um contraste simples (veja a 
Tabela 8.6), no qual as condigoes da cerveja 
e do vinho sao comparadas com a da agua, 
ou usando um contraste de diferenga no qual 
ambas as condigoes do alcool sao compara¬ 
das com a condigao da agua antes de serem 
comparadas entre si. Em qualquer um dos ca- 
sos e essencial que a condigao da agua entre 
ou como o primeiro ou como o ultimo nivel 
da variavel independente drink (porque voce 
nao pode especificar o nivel do meio como a 
categoria referenda num contraste simples). 
Agora, vamos pensar sobre o segundo fator. 
O fator imagem tambem tem uma categoria 
de controle que nao era esperado que rnudas- 
se atitudes (imagens neutras). Como anterior- 
mente, podemos estar interessados em usar 
essa categoria como uma categoria referenda 
num contraste simplest assim e importante 
que essa categoria neutra entre ou como pri¬ 
meiro ou como ultimo nivel. 

Com base no que foi discutido sobre o 
uso de contrastes, nao faz sentido ter agua 
como nivel 3 do fator drink e neutra como 
o terceiro nivel do fator imagens. Os nfveis 
restantes podem ser decididos arbitrariamen- 
te. Escolhi cerveja como nivel 1 e vinho como 
nivel 2 do fator drink (bebida). Para a varia¬ 
vel imagery (imagem) escolhi positiva como 
nivel 1 e negativa como nivel 2. Essas deci- 
soes significam que as variaveis devem entrar 
da seguinte forma: 


3 Esperamos que as imagens positivas melhorem as ati¬ 
tudes, e que as imagens negativas tornam as atitudes 
mais negativas. Portanto, nao faz sentido fazer um con¬ 
traste Helmert ou contraste de diferenga para esse fator 
porque os efeitos das duas condigoes experimentais 
irao cancelar a si mesmas. 


beerpos 

E 

_?_d. 

beerneg 

E 


beerneut 

E 

_?_d, 

winepos 

E 

_?_(2, 

wineneg 

E 

_?_( 2 , 

wineneut 

E 

_?_( 2 , 

waterpos 

E 

_?_(3, 

waterneg 

E 

_?_(3, 

waterneu 

E 

_?_(3, 


Coincidentemente, essa e a ordern na qual 
as variaveis estao listadas no editor de dados; 
a coincidencia aconteceu simplesmente por¬ 
que eu me antecipei e pensei o que os contras¬ 
tes fariam e, entao, entrei com as variaveis na 
ordem apropriada! Quando essas variaveis fo¬ 
re m transferidas, a caixa de dialogo deve ficar 
exatamente igual a da Figura 11.8. Os botoes 
na parte de baixo da tela ja foram descritos 
para o caso da variavel independente e, assim, 
irei descrever somente a mais relevante. 


11.8.2 Contrastes© 

Depois da analise principal e interessante 
comparar niveis das variaveis independentes 
para ver se elas diferem. Como vimos, ha difi- 
culdade para entrar com codigos dos contrastes 
(a nao ser que voce use sintaxe), assim, temos 
que confiar nos contraste padrao disponiveis 
(veja a Tabela 8.6). A Figura 11.9 mostra a cai¬ 
xa de dialogo para a condugao de contrastes 
e e obtida clicando em • (Contrastes) na 
caixa de dialogo principal. Na segao anterior, 
descrevi por que deve ser interessante usar 
agua e condigoes neutras como categorias base 
para os fatores drink (bebida) e imagery (ima¬ 
gem), respectivamente. Usamos a caixa de dia¬ 
logo contrasts (Contrastes) antes, nas segoes 
9.3.3 e 11.4.2 e, assim, voce deve selecionar 
um contraste simples para cada variavel inde¬ 
pendente. Para ambas as variaveis independen¬ 
tes, entramos com as variaveis de maneira que 
a categoria de controle fosse a ultima; portan¬ 
to, nao precisamos trocar a categoria de refe¬ 
renda pelo contraste simples. Uma vez que os 
contrastes foram selecionados, clique em l c * i,i - 
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Figura 11.8 Caixa de dialogo principal final para a analise dentre participantes de medidas re- 
petidas 



Figura 11.9 Contrastes de medidas repetidas. 


(Continuar) para retornar a caixa de dialogo 
principal. Uma alternativa aos contrastes dis- 
ponrveis aqui e fazer uma analise dos efeitos 
simples (veja o Quadro 11.1). 

11.8.3 llustrando interacoes © 

Quando tinhamos somente uma variavel 
independente, ignoramos a caixa de dialogo 


plots (desenhar); contudo, se existem dois ou 
mais fatores, a caixa de dialogo e uma maneira 
conveniente para tragar as medias para cada nf- 
vel dos fatores. Para acessar essa caixa de dia¬ 
logo, clique em *** (Diagramas). Selecione 
drink da lista de variaveis no lado esquerdo 
da caixa de dialogo e transfira-a para o espago 
denominado Horizontal Axis (Eixo Horizon¬ 
tal) clicando em _il No espago denominado 
Separate Lines (Linhas Separadas) precisa- 
mos colocar a variavel independente restante: 
imagery. Como antes, fica a seu criterio de que 
maneira tragar o grafico. Quando voce tiver 
movido as duas variaveis independentes para 
a caixa apropriada, clique em w (Adicio- 
nar) e esse grafico de interagao sera acrescido 
a lista na parte de baixo da caixa (veja a Figura 
11.10). Quando voce terminar com a especifi- 
cagao dos graficos, clique em <*** (Continuar) 
para retornar a caixa de dialogo principal. 

11.8.4 Outras opgdes © 

Voce deve notar que os testes post hoc 
estao desabilitados somente para os delinea- 











































Descobrindo a Estatistica Usaimdo o SPSS 423 



Figura 11.10 Caixa de dialogo "diagramas" 
para a ANOVA de medidas repetidas. 


mentos de medidas repetidas. Portanto, as Ulri¬ 
cas opgoes restantes estao na caixa de dialogo 
options, que e acessada clicando em ° pl0 '’* 
(opgSes). As opgoes aqui sao as mesmas que 
para a ANOVA de um fator. Recomendo sele- 
cionar algumas estatfsticas descritivas, e voce 
pode querer selecionar algumas comparagoes 
multiplas, selecionando todos os fatores na cai¬ 
xa denominada de Factor(s) and Factor Inte¬ 
ractions (Fator(es) e Interagries de Fatores) e 
tranfira-os para a caixa denominada Display 
Means for (Exibir Medias) clicando em LD 
(veja a Figura 11.1). Tendo selecionado essas 
variaveis, voce deve marcar a caixa denomi¬ 
nada Compare main effects (Compare efei- 
tos principais) lRcomcM>moin^5r e selecione uma 



Quadro 11.1 


Analise dos efeitos simples © 

Vimos no capitulo anterior que outra maneira de decompor um termo de 
interagao e usar uma tecnica chamada de analise dos "efeitos simples". Essa 
analise observa o efeito de uma variavel independents em niveis individuals da 
outra variavel independents. Assim, para esse exemplo, podemos observar o 
efeito da bebida para imagens positivas, para imagens negativas e, entao, para 
imagens neutras. Tambem poderiamos analisar o efeito das imagens separada- 
mente para cerveja, vinho e agua. Com delineamentos de medidas repetidas podemos, ainda, 
conduzir efeitos simples por meio da sintaxe do SPSS, mas a sintaxe que usamos e ligeiramente 
diferente. A sintaxe que voce precisa usar e: 

MANOVA 

beerpos beerneg beerneut winepos wineneg wineneut waterpos waterneg waterneu 

/WSFACTORS drink (3) imagery (3) 

* Isso inicia a ANOVA especificando as variaveis no editor de dados que se referem aos niveis 
das nossas variaveis de medidas repetidas. 0 comando /WSFACTORS define as duas variaveis de 
medidas repetidas que temos. A ordem na qual listamos as variaveis do editor de dados e importan- 
te. Assim, porque definimos que bebida(3) imagem(3) o SPSS inicia no nivel 1 de bebida e porque 
especificamos os tres niveis de imagens, ele usa as primeiras tres variaveis listadas como os niveis 
de imagens no nivel 1 de bebida. Ele continua no nivel 2 de bebida e novamente observa as proxi- 
mas tres variaveis na lista para serem relevantes niveis de imagens. Finalmente, ele continua no nivel 
3 de bebida e usa as proximas tres variaveis (as ultimas tres, nesse caso) para serem os niveis de 
imagens. Isso e dificil de explicar, mas observe a ordem das variaveis e veja que as primeiras tres se 
referem a cerveja (e diferem de acordo com imagens), as proximas tres sao vinho e os tres niveis de 
imagens e as ultimas tres sao agua, ordenadas novamente de acordo com imagens. Porque nos as 
ordenamos dessa maneira, temos que definir bebida(3) e, entao, imagens(3). (Seria igualmente va- 
lido escrever /WSFACTORS imagery(3) drink(3), mas somente se inicialmente tivessemos ordenado 
as variaveis: beerpos winepos waterpos beerneg wineneg waterneg beerneut wineneut waterneu.) 

[Continua) 






























424 Andy Field 


Quadro 11.1 ( Continuagao) 


/WSDESIGN = MWITHIN drink(l) MWITHIN drink(2) MWITHIN drink(3) 

* Isso especifica os efeitos simples. Por exemplo, "MWITHIN drink(l)" solicita ao SPSS ana- 
lisar o efeito de imagem no nivel 1 de bebida (isto e, quando a cerveja foi usada). Se voce quiser 
comparar bebida aos niveis de imagens, escrevenamos isso ao contrario: 

/WSDESIGN = MWITHIN imagery(l) MWITHIN imagery (2) MWITHIN imagery (3) 

/PRINT 

SIGNIF (UNIV MULT AVERF HF GG) 

* Essas linhas finais apenas solicitam que a ANOVA principal seja impressa (SIGNIF). A sin- 
taxe para olhar o efeito de imagens em diferentes niveis de bebida esta armazenada no arquivo 
denominado SimpleEffectsAttitude.sps para voce olhar. Abra esse arquivo (confira se voce tam- 
bem tern Attitude.sav carregado no editor de dados) e execute a sintaxe. A saida que voce ira 
conseguir sera na forma de texto (em vez de tabelas bonitas). Parte dela ira duplicar os resultados 
da ANOVA principal. Os efeitos simples sao apresentados assim: 

************A nalysis of Variance- design 1 ************* 
(Analise de Variancia - delineamento 1) 

Tests involving "MWITHIN DRINK(l) Within-Subject Effect. 

(Testes envolvendo "MWITHIN DRINK(l) Efeito Entre Participantes) 

Tests of Significance for T1 using UNIQUE sums of squares 
(Testes de significancia para T1 utilizando soma dos quadrados UNIQUE) 


Source of Variation 

SS 

DF 

MS 

F Sig of F 

(Fonte de Variagao) 

SS 

GL 

MS 

F Sig de F) 

WITHIN+RESIDUAL 

(Entre + Residuo) 

7826,67 

19 

412,09 


MWITHIN DRINK(1) 

(Entre Bebida(1)) 

8401,67 

1 

8401,67 

20,39 0,000 

************A n a 1 y 

sis of 

Va r i 

a n c e - 

de sign 1 ********* 


(Analise de Variancia - delineamento 1) 

Tests involving "MWITHIN DRINK(2) Within-Subject Effect. 

(Testes envolvendo "MWITHIN DRINK(2) Efeito Entre Participantes) 

Tests of Significance for T2 using UNIQUE sums of squares 
(Testes de significancia para T2 utilizando soma dos quadrados UNIQUE) 


Source of Variation 

SS 

DF 

MS 

F 

Sig of F 

(Fonte de Variagao) 

SS 

GL 

MS 

F 

Sig de F) 

WITHIN+RESIDUAL 

376,00 

19 

19,79 



(Entre + Residuo) 






MWITHIN DRINK(2) 

4166,67 

1 

4166,67 

210,55 

0,000 


(Entre Bebida(2)) 


(i Continua) 
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Quadro 11.1 (Continuaqao) 


************A nalysis of Variance- design 1 ************* 
(Analise de Variancia - delineamento 1) 

Tests involving "MWITHIN DRINK(3) Within-Subject Effect. 

(Testes envolvendo "MWITHIN DRINK(3) Efeito Entre Participantes) 

Tests of Significance for T3 using UNIQUE sums of squares 
(Testes de significancia para T3 utilizando soma dos quadrados UNIQUE) 


Source of Variation 

SS 

DF 

MS 

F 

Sig of F 

(Fonte de Variagao) 

SS 

GL 

MS 

F 

Sig de F) 

WITHIN+RESIDUAL 

1500,32 

19 

78,96 



(Entre + Residuo) 






MWITHIN DRINK(3) 

742,02 

1 

742,02 

9,40 

0,006 


(Entre Bebida(3)) 


A tabela denominada "MWITHIN DRINK(1)"fornece uma ANOVA do efeito das 
imagens para cerveja e as tabelas subsequentes sao para vinho e agua, respecti- 
vamente. Observando os valores de significance para cada efeito simples parece 
que existem efeitos significativos de imagens em todos os niveis da bebida! 

Podemos, tambem, complementar os efeitos com contrastes especialmente 
definidos para o termo de interagao. Infelizmente, isso somente pode ser feito usando a sintaxe 
e e um processo bem envolvente, assim, se isso e algo que voce queira fazer, veja o arquivo 
ContrastsUsingSyntax.pdf no site www.artmed.com.br. 




Figura 11.11 Caixa de dialogo "opgoes" para a ANOVA de medidas repetidas. 
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corregao apropriada (eu escolhi Bonferroni). 
A unica opgao restante de especial interesse 
e selecionar a opgao Transformation matrix 
(Matriz de Transformagao). Essa opgao pro- 
duz muitas safdas extras, mas e importante 
para interpretar a safda dos contrastes. 

11.9 SAIDAS PARA A ANOVA FATORIAL 
DEMEDIDAS REPETIDAS © 

11.9.1 Descritivas e analise principal © 

A safda do SPSS 11.9 mostra a safda ini- 
cial dessa ANOVA. A primeira tabela apenas 
lista as variaveis que foram inclufdas no edi¬ 
tor de dados e o nfvel de cada variavel inde- 
pendente que elas representam. Essa tabela e 
mais importante do que pode parecer porque 
ela permite verificar que voce entrou com as 
variaveis na ordem correta para as compara- 
goes que voce deseja fazer. A segunda tabela 
e a de descritivas e fornece a media e o desvio 
padrao para cada uma das nove condicdes. Os 
nomes nessa tabela sao os que forneci para as 
variaveis no editor de dados (portanto, se voce 
nao deu a essas variaveis nomes completos, 
ela sera um pouco diferente). 

As descritivas sao interessantes porque 
elas nos dizem que a variabilidade entre es- 


cores foi maior quando a cerveja foi usada 
como um produto (compare os desvios pa¬ 
drao da variavel cerveja contras as outras). Da 
mesma forma, quando a imagem de um cada¬ 
ver foi usada, os indices dados aos produtos 
foram negativos (como esperado) para vinho 
e agua, mas nao para cerveja (assim, por al- 
guma razao, as imagens negativas parecem 
nao funcionar quando a cerveja foi utilizada 
como um estfmulo). Os valores nessa tabela 
nos ajudarao a interpretar os efeitos princi¬ 
pals da analise. 

A Safda 11.10 do SPSS mostra os resulta- 
dos do teste de esfericidade de Mauchly (veja 
a Segao 11.2.3) para cada um dos tres efeitos 
no modelo (dois efeitos principals e uma in- 
teragao). Os valores de significancia desses 
testes indicam que ambos os efeitos principals 
de bebida e imagens violaram essa hipotese 
e, assim, os valores de F devem ser corrigidos 
(veja a Segao 11.5.2). Para a interagao, a hipo¬ 
tese de esfericidade e encontrada (porque p > 
0,05) e, assim, nao precisamos corrigir a razao 
F para esse efeito. 

A Safda 11.11 do SPSS mostra os resulta- 
dos para a ANOVA (com valores F corrigidos 
- se alguns de voces estiverem usando a ver- 
sao 7.5 ou anterior, expanda a tabela produzi- 
da usando o metodo descrito na Segao 11.5.3). 


Saida 11.9 do SPSS 

Within-Subjects Factors 
(Fatores entre Participantes) 

Measure: MEASUREJ (Medida: MEDI- 

Da 1) Descriptive Statistics (Estatisticas Descritivas) 



Mean 

(Media) 

Std. Deviation 
(Desvio Padrao) 

N 

Beer + Sexy (Cerveja + Sexy) 

21.0500 

13.0080 

20 

Beer + Corpse (Cerveja + Cadaver) 

4.4500 

17.3037 

20 

Beer + Person in Armchair (Cerveja 

10.0000 

10.2956 

20 

+ Pessoa Sentada) 




Wine + Sexy (Vinho + Sexy) 

23.3500 

6.7378 

20 

Wine + Corpse (Vinho + Cadaver) 

-12.0000 

6.1815 

20 

Wine + Person in Armchair (Vinho 

11.6500 

6.2431 

20 

+ Pessoa Sentada) 




Water + Sexy (Agua + Sexy) 

17.4000 

7.0740 

20 

Water + Corpse (Agua + Cadaver) 

-9.2000 

6.8025 

20 

Water + Person in Armchair (Agua 

2.3500 

6.8386 

20 

+ Pessoa Sentada) 





DRINK 

(Bebida) 

IMAGERY 

(Imagem) 

Dependent 

Variable 

(Variavel 

Dependente) 

i 

i 

BEERPOS 


2 

BEERNEG 


3 

BEERNEUT 

2 

1 

WINEPOS 


2 

WINENEG 


3 

WINENEUT 

3 

1 

WATERPOS 


2 

WATERNEG 


3 

WATERNEU 
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Saida do SPSS 11.10 

Mauchly's Test of Sphericity 11 (Teste de Mauchly da Esfericidade) 


Measure: MEASUREJ (Medida: MEDIDA_1) 


Within-S ubjects 
Effect (Efeito entre 
Participantes) 

Mauchly's 
W( W de 
Mauchly) 

Approx. Chi-Square 
(Qui-Quadrado 
Aproximado) 

df 

(gi) 

Sig. 

(Sig.) 

Epsilon 8 

Greenhouse- 

Geisser 

Huynh- 

Feldt 

Lower- 

bound 

(Limite 

Inferior) 

DRINK (Bebida) 

0.267 

23.753 

2 

0.000 

0.577 

0.591 

0.500 

IMAGERY (Imagem) 

0.662 

7.422 

2 

0.024 

0.747 

0.797 

0.500 

DRINK* IMAGERY 

0.595 

9.041 

9 

0.436 

0.798 

0.979 

0.250 

(Bebida * Imagem) 









Testa a hipotese nula de que a matriz de covariancia dos erros das variaveis dependentes transformadas e ortonormaliza- 
das e proporcional a uma matriz identidade. 

a Pode ser utilizado para ajustar os graus de liberdade dos testes de significancia para medias. Os testes corrigidos sao 
mostrados em camadas (por padrao) na tabela dos testes de efeitos entre participantes. 
b Delineamento: Intercepto dentre participantes: BEBIDA-IMAGEM + BEBIDA*IMAGEM. 


A safda e dividida em segoes que se referem 
a cada um dos efeitos no modelo e os termos 
erro associados com esses efeitos. Observan- 
do os valores de significancia esta claro que 
existe um efeito significativo do tipo de bebi- 
da usado como um estfmulo, um efeito prin¬ 
cipal significativo do tipo de imagens usadas 
e uma interagao significativa entre essas duas 
variaveis. Irei examinar cada um desses efei¬ 
tos em turnos. 


11.9.2 0 efeito da bebida © 

A primeira parte da Safda 11.11 do SPSS 
nos fala do efeito do tipo da bebida usada no 
comercial. Para esse efeito devemos observar 
um dos valores de significancia corrigidos 
porque a esfericidade foi violada. Todos os 
valores corrigidos sao significativos e, assim, 
devemos relatar os valores conservadores dos 
graus de liberdade corrigidos de Greenhouse e 
Geisser. Esse efeito nos diz que se ignorarmos 
o tipo de imagens que foram usadas os parti¬ 
cipantes ainda avaliaram alguns tipos de bebi- 
das de forma significativamente diferente. 

Na Segao 11.8.4, solicitamos ao SPSS 
que mostrasse as medias de todos os efeitos no 
modelo (antes de conduzir os testes post hoc ) 
e se voce der uma olhada por toda a sua safda, 
devera encontrar a tabela da Safda 11.12 do 
SPSS na segao denominada Estimated Mar¬ 


ginal Means 4 (Medias Marginais Estimadas). 
A Safda 11.12 do SPSS e uma tabela de me¬ 
dias para o efeito principal de bebida com os 
erros padrao associados. Os nfveis dessa va¬ 
riavel sao denominados 1, 2 e 3 e, assim, de¬ 
vemos lembrar como entramos a variavel para 
ver qual linha da tabela se relaciona a que con¬ 
digao. Entramos essa variavel com a condigao 
cerveja primeiro e a condigao agua por ultimo. 
A Figura 11.12 usa essa transformagao para 
mostrar as medias para cada condigao. Fica 
claro a partir desse grafico que cerveja e vinho 
tern, naturalmente, uma avaliagao mais alta do 
que a agua (tendo a cerveja a avaliagao mais 
alta). Para ver a natureza desse efeito pode- 
mos observar os testes post hoc (veja a seguir) 
e os contrastes (veja a Segao 11.9.5). 

A Safda 11.13 do SPSS mostra compara- 
goes de pares para o efeito principal corrigi- 
do de bebida usando o ajuste de Bonferroni. 
Essa tabela indica que o efeito principal sig¬ 
nificativo reflete uma diferenga significativa 
(p < 0,01) entre os nfveis 2 e 3 (vinho e agua). 


4 Essas medias sao obtidas calculando as medias das me- 
dias na Safda 11.9 do SPSS para uma condigao dada. 
Por exemplo, a media para a condigao da cerveja (igno- 
rando imagens) e: 


-^Cerveja (-^Cerveja-)-Sexy ~T -^Cerveja+Caddver "T -^Cerveja+NeutroV^ 


= (21,05 + 4,45 + 10,00)/3 = 11,83 
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Saida 11.11 do SPSS 

Tests of Within-Sub/ects Effects (Testes de efeitos entre participantes) 


Measure: MEASURE_1 (Medida: MEDIDA1) 


Source (Fonte) 

Tipe Hi Sum of 
Squares (Soma dos 
quadrados do tipo III) 

df (gl) 

Mean Square 
(Media dos 
quadrados) 

F 

Sig. 

DRINK (Bebida) 

Sphericity Assumed (Esferici- 

2092.344 

2 

1046.172 

5.106 

0.011 


dade Assumida) 







Greenhouse-Geisser 

2092.344 

1.154 

1812.764 

5.106 

0.030 


Huynh-Feldt 

2092.344 

1.181 

1770.939 

5.106 

0.029 


Lower-bound (Limite inferior) 

2092.344 

1.000 

2092.344 

5.106 

0.036 

Error(DRINK) 

Sphericity Assumed (Esferici- 

7785.878 

38 

204.892 



(Erro(Bebida)) 

dade Assumida) 







Greenhouse-Geisser 

7785.878 

21.930 

355.028 




Huynh-Feldt 

7785.878 

22.448 

346.836 




Lower-bound (Limite inferior) 

7785.878 

19.000 

409.783 



IMAGERY (Ima- 

Sphericity Assumed (Esferici- 

21628.678 

2 

10814.339 

122.565 

0.000 

gem) 

dade Assumida) 







Greenhouse-Geisser 

21628.678 

1.495 

14468.490 

122.565 

0.000 


Huynh-Feldt 

21628.678 

1.594 

13571.496 

122.565 

0.000 


Lower-bound (Limite inferior) 

21628.678 

1.000 

21628.678 

122.565 

0.000 

Error(IMAGERY) 

Sphericity Assumed (Esferici- 

3352.878 

38 

88.234 



(Erro(lmagem)) 

dade Assumida) 







Greenhouse-Geisser 

3352.878 

28.403 

118.048 




Huynh-Feldt 

3352.878 

30.280 

110.729 




Lower-bound (Limite inferior) 

3352.878 

19.000 

176.467 



DRINK*IMA GERY 

Sphericity Assumed (Esferici- 

2624.422 

4 

656.106 

17.155 

0.000 

(Bebida*lmagem) 

dade Assumida) 







Greenhouse-Geisser 

2624.422 

3.194 

821.778 

17.155 

0.000 


Huynh-Feldt 

2624.422 

3.914 

670.462 

17.155 

0.000 


Lower-bound (Limite inferior) 

2624.422 

1.000 

2624.422 

17.155 

0.001 

ErrorfDRINK* 

Sphericity Assumed (Esferici- 

2906.689 

76 

38.246 



IMAGERY) 

dade Assumida) 






(Erro(Bebida* 

Greenhouse-Geisser 

2906.689 

60.678 

47.903 



Imagem) 

Huynh-Feldt 

2906.689 

74.373 

39.083 




Lower-bound (Limite inferior) 

2906.689 

19.000 

152.984 




Saida 11.12 do SPSS 

Estimates (Estimativas) 

Measure: MEASURE_1 (Medida: MEDIDA1) 


DRINK 

(Bebida) 

Mean 

(Media) 

Std. 

Error 

(Erro 

Padrao) 

95% Confidence 
Interval (Intervalo de 
95% de confianca) 

Lower 

Bound 

(Limite 

Inferior) 

Upper 

Bound 

(Limite 

Superior) 

1 

11.833 

2.621 

6.348 

17.319 

2 

8.333 

0.574 

7.131 

9.535 

3 

3.517 

1.147 

1.116 

5.918 


Curiosamente, a diferenga entre as condigoes 
cerveja e agua e maior do que para as de vi- 
nho e agua, mas esse efeito nao e significa¬ 
tive (p > 0,05). Essa inconsistency pode ser 
explicada observando o erro padrao na con- 
dicao da cerveja comparada com a condicao 
do vinho. O erro padrao para a condigao do 
vinho e incrivelmente menor e, assim, a dife¬ 
renga entre as medias e relativamente grande 
(veja o Capftulo 6). Tente executar novamen- 
te os testes post hoc, mas selecione os valores 
nao corrigidos (LSD) na caixa de dialogo op¬ 
tions (veja a Segao 11.8.4). Voce deve desco- 
brir que a diferenga entre cerveja e agua ago¬ 
ra e significativa (p = 0,02). Essa descoberta 
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Figura 11.12 



Bebida 

Grafico de barras de erro mostrando a media de cada condigao. 


Saida 11.13 do SPSS 


Pairwise Comparisons (Comparagoes aos Pares) 


Measure: MEASURE 1 (Medida: MEDIDA1) 


(!) DRINK 
((1) Bebida) 

(J) DRINK 
(J) Bebida 

Mean Difference 
(/ - J) (Diferenga 
Media) 

Std. Error 
(Erro Padrao) 

S/S’. 8 

95% Confidence Interval for 
difference‘ (Intervalo de 95% 
de confianga para diferenpa) 

Lower Bound 
(Limite Inferior) 

Upper Bound 
(Limite Superior) 

1 

2 

3.500 

2.849 

0.703 

-3.980 

10.980 


3 

8.317 

3.335 

0.066 

-0.438 

17.072 

2 

1 

-3.500 

2.849 

0.703 

-10.980 

3.980 


3 

4.817* 

1.116 

0.001 

1.886 

7.747 

3 

1 

-8.317 

3.335 

0.066 

-17.072 

0.438 


2 

-4.817* 

1.116 

0.001 

-7.747 

-1.886 


Com base nas medias marginais estimadas) 

* A diferenga media e significativa ao nivel de 0,05. 
a Ajuste para comparagoes multiplas: Bonferroni. 


ressalta a importancia do controle da taxa do 
erro usando a corregao de Bonferroni. Se nao 
tivessemos usado essa corregao poderiamos 


ter conclufdo erroneamente que a cerveja 
teve avaliagao significativamente mais alta 
do que a agua. 
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11.9.3 0 efeito da imagem © 

A Saida 11.11 do SPSS tambem indi- 
ca que o efeito do tipo de imagens usadas no 
anuncio teve uma influencia significativa nas 
avaliagoes dos estlmulos dos participantes. No- 
vamente, devemos observar um dos valores de 
significance corrigidos porque a esfericidade 
foi violada (veja anteriormente). Todos os va¬ 
lores corrigidos sao altamente significativos e, 
assim, podemos novamente relatar os valores 
corrigidos dos graus de liberdade da estatfstica 
de Greenhouse e Geisser. Esse efeito nos diz 
que se ignorarmos o tipo de bebida que foi usa- 
do, as avaliagoes dos participantes dessas bebi- 
das foram diferentes de acordo com o tipo de 
imagens usado. Na Segao 11.8.4, solicitamos 
medias para todos os efeitos no modelo e se 
voce olhar as saldas devera encontrar a Tabe- 
la 11.14 (apos a comparagao dos pares para o 
efeito principal de bebida). Essa sat'da do SPSS 


e uma tabela de medias para o efeito principal 
de imagens com os erros padrao associados. 
Os rn'veis dessa variavel estao rotulados como 
1, 2 e 3 e, assim, devemos nos lembrar como 
entramos com a variavel para ver qual linha da 
tabela se relaciona com qual cond^ao. Nos en- 


Saida 11.14 do SPSS 

Estimates (Estimativas) 

Measure: MEASUREJ (Medida: MEDIDA1) 


IMAGERY 

(Imagem) 

Mean 

(Media) 

Std. 

Error 

(Erro 

Padrao) 

95% Confidence 
Interval (Intervalo de 
95% de confian$a) 

Lower 

Bound 

(Limite 

Inferior) 

Upper 

Bound 

(Limite 

Superior) 

i 

21.267 

0.977 

19.222 

23.312 

2 

-5.583 

1.653 

-9.043 

-2.124 

3 

8.000 

0.969 

5.972 

10.028 


20,00 


<d 10,00 

■o 

3 


< 


0,00 


- 10,00 



Positiva Negativa Neutra 

Imagem 

Figura 11.13 Grafico de barras de erro mostrando o efeito da imagem em cada condi$ao. 
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Saida 11.15 do SPSS 


Pairwise Comparisons (Comparacoes aos Pares) 


Measure: MEASURE1 (Medida: MEDIDA1) 


(!) IMAGERY 
((1) Imagem 

(j) IMAGERY 
(J) Imagem) 

Mean 

Difference (1 - J) 
(Diferenga Media) 

Std. Error 
(Erro 
Padrao) 

Sig. a 

95% Confidence Interval for 
Difference a (Intervalo de 95% 
de Confianga para a Diferenga) 

Lower Bound 
(Limite Inferior) 

Upper Bound 
(Limite Superior) 

i 

2 

26.850* 

1.915 

0.000 

21.824 

31.876 


3 

13.267* 

1.113 

0.000 

10.346 

16.187 

2 

1 

-26.850* 

1.915 

0.000 

-31.876 

-21.824 


3 

-13.582* 

1.980 

0.000 

-18.781 

-8.386 

3 

1 

-13.267* 

1.113 

0.000 

-16.187 

-10.346 


2 

13.583* 

1.980 

0.000 

8.386 

18.781 


Based on estimated marginal means (Com base nas medias marginais estimadas) 

* The mean difference is significant at the .05 level (A diferenga media e significativa ao nivel de 0,05) 
a Adjustement for multiple comparisons: Bonferroni (Ajuste para comparagoes multiplas: Bonferroni) 


tramos essa variavel com a condigao positiva 
primeiro e a condigao neutra por ultimo. A Fi- 
gura 11.13 usa essa informagao para ilustrar as 
medias para cada condicao. Fica claro, a partir 
desse grafico, que a imagem positiva resultou 
em uma avaliagao muito positiva (comparada 
com a imagem neutra) e a imagem negativa 
resultou em uma avaliagao negativa (especial- 
mente comparada ao efeito de imagem neutra). 
Para ver a natureza desse efeito podemos olhar 
aos testes post hoc (veja anteriormente) e os 
contrastes (veja a Segao 11.9.5). 

A Saida 11.15 do SPSS mostra a compa- 
ragao dos pares para o efeito principal corrigi- 
do de imagens usando o ajuste de Bonferroni. 
Essa tabela indica que o efeito principal signi¬ 
ficative reflete diferengas significativas (todos 
p < 0,01) entre niveis 1 e 2 (positiva e nega¬ 
tiva), entre niveis 1 e 3 (positiva e neutra) e 
entre niveis 2 e 3 (negativa e neutra). 

11.9.4 0 efeito interagao (bebida x 
imagem) © 

A Saida 11.11 do SPSS indicava que as 
imagens interagiam de alguma maneira com o 
tipo de bebida usada como estimulo. Daquela 
tabela devemos relatar que havia uma intera¬ 
gao significativa entre o tipo de bebida usada e 
imagens associadas a ela, F( 4, 76) = 17,16, p 


< 0,001. Esse efeito nos diz que o tipo de ima¬ 
gens usadas tern efeito diferente dependendo 
do tipo de bebida com que ela foi apresentada 
junto. Como antes, podemos usar as medias 
que solicitamos na Segao 11.8.4 para deter- 
minar a natureza dessa interagao (essa tabela 
deve estar abaixo das comparacoes dos pares 
para imagens e esta exibida na Saida 11.16 do 
SPSS). A tabela das medias na Saida 11.16 do 
SPSS e essencialmente a mesma das estatisti- 
cas descritivas iniciais na Saida 11.9 do SPSS 
exceto que os erros padrao estao exibidos em 
vez dos desvios padrao. 

As medias na Saida 11.16 do SPSS sao 
usadas para criar o grafico que solicitamos na 
Segao 11.8.3 e esse grafico e essencial para 
a interpretagao da interagao. A Figura 11.14 
mostra o grafico de interagao (levemente rno- 
dificado para ficar mais bonito!) e estamos 
procurando por linhas nao-paralelas. O grafi¬ 
co mostra que o padrao das respostas ao longo 
das bebidas foi similar quando imagens posi- 
tivas e neutras foram usadas. Isto e, as avalia- 
goes foram positivas para cerveja, levemente 
altas para vinho e baixaram levemente para 
agua. O fato de que a linha representando ima¬ 
gens positivas e mais alta do que a linha neu¬ 
tra indica que imagens positivas aumentam as 
avaliagoes mais do que imagens neutras para 
todas as bebidas. A linha mais embaixo (re- 
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Saida 11.16 do SPSS 


Estimates (Estimativas) 


Measure: MEASUREJ (Medida: MEDIDA1) 


DRINK IMAGERY 
(Bebida) (Imagem) 

Mean 

(Media) 

Std. Error 
(Erro Padrao) 

95% Confidence Interval 
(Intervalo de 95% de Confianga) 

Lower Bound 
(Limite Inferior) 

Upper Bound 
(Limite Superior) 

i i 

21.050 

2.909 

14.962 

27.138 

2 

4.450 

3.869 

-3.648 

12.548 

3 

10.000 

2.302 

5.181 

14.819 

2 1 

25.350 

1.507 

22.197 

28.503 

2 

-12.000 

1.382 

-14.893 

-9.107 

3 

11.650 

1.396 

8.728 

14.572 

3 1 

17.400 

1.582 

14.089 

20.711 

2 

-9.200 

1.521 

-12.384 

-6.016 

3 

2.350 

1.529 

-0.851 

5.551 



Figura 11.14 Grafico de interagao para Attitude.sav. 0 tipo de imagens e representado pelas tres 
linhas: imagens positivas (circulos), imagens negativas (quadrados) e imagens neutras (triangulos). 


presentando imagens negativas) mostra um 
efeito diferente: as avaliagoes foram mais bai- 
xas para vinho e agua, mas nao para cerveja. 
Portanto, imagens negativas tiveram o efeito 
desejado em atitudes em relacao ao vinho e 
agua, mas, por alguma razao, atitudes em re- 


lagao a cerveja permaneceram praticamente 
neutras. Portanto, a interacao provavelmente 
reflete o fato de que imagens negativas tern 
efeito diferente em ambas as imagens, positi- 
va e neutra (porque ela diminui as avaliagoes 
em vez de aumenta-las). Essa interagao esta 
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completamente de acordo com as previsoes 
experimentais. Para verificar a interpretagao 
do efeito de interagao precisamos observar os 
contrastes que solicitamos na Segao 11.8.2. 

11.9.5 Contrastes para variaveis de 
medidas repetidas © 

Na Segao 11.8.2, solicitamos contrastes 
simples para a variavel drink (para qual a 
agua foi usada como a categoria controle) e 


para a categoria imagery (para qual a catego¬ 
ria imagem neutra foi usada como controle). 
A Saida 11.17 do SPSS mostra um resumo 
dos resultados para esses contrastes. A tabela 
e dividida em efeitos principais e interagbes 
e cada efeito e dividido nos componentes do 
contraste. Assim, para o efeito principal da 
bebida, o primeiro contraste compara o nlvel 
1 (cerveja) com a categoria base (nesse caso, a 
ultima categoria: agua). Se voce esta confuso 
sobres os niveis, lembre que na Saida 11.9 do 


Saida 11.17 do SPSS 

Tests of Within-Subjects Contrasts (Testes dos contrastes entre participantes) 


Measure: MEASUREJ (Medida: MEDIDA1) 





Tlpe III Sum of 


Mean 






Squares (Soma 


Square 






dos quadrados 

df 

(Media dos 



Source (Fonte) 

DRINK (Bebida) 

IMAGERY (Imagem) 

do tipo III) 

(gi) 

quadrados) 

F 

Sig. 

DRINK 

Level 1 vs. Level 3 


1383.339 

1 

1383.339 

6.218 

0.022 

(Bebida) 

(Nivel 1 vs. Nivel 3) 








Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 


464.006 

1 

464.006 

18.613 

0.000 

Error(DRINK) 

Level 1 vs. Level 3 


4226.772 

19 

222.462 



(Erro(Bebida)) 

(Nivel 1 vs. Nivel 3) 








Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 


473.661 

19 

24.930 



IMAGERY 


Level 1 vs. Level 3 

3520.089 

1 

3520.089 

142.194 

0.000 

(Imagem) 


(Nivel 1 vs. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 

3690.139 

1 

3690.139 

47.070 

0.000 

Error(IMAGERY) 


Level 1 vs. Level 3 

470.356 

19 

24.756 



(Erro(lmagem)) 


(Nivel 1 vs. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 

1489.528 

19 

78.396 



DRINK * 

Level 1 vs. Level 3 

Level 1 ws. Level 3 

320.000 

1 

320.000 

1.576 

0.225 

IMAGERY 

(Nivel 1 vs. Nivel 3) 

(Nivel 1 vs. Nivel 3) 






(Bebida* 


Level2 vs. Level 3 

720.000 

1 

720.000 

6.752 

0.018 

Imagem) 


(Nivel 2 vs. Nivel 3) 







Level 2 vs. Level 3 

Level 1 vs. Level 3 

36.450 

1 

36.450 

0.235 

0.633 


(Nivel 2 vs. Nivel 3) 

(Nivel 1 vs. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 

2928.200 

1 

2928.200 

26.906 

0.000 

ErrorfDRINK* 

Level 1 vs. Level 3 

Level 1 vs. Level 3 

3858.000 

19 

203.053 



IMAGERY) 

(Nivel 1 vs. Nivel 3) 

(Nivel 1 vs. Nivel 3) 






(Erro(Bebida* 


Level2 vs. Level 3 

2026.000 

19 

106.632 



Imagem) 


(Nivel 2 vs. Nivel 3) 







Level 2 vs. Level 3 

Level 1 vs. Level 3 

2946.550 

19 

155.082 




(Nivel 2 vs. Nivel 3) 

(Nivel 1 vs. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 

2067.800 

19 

108.832 
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SPSS existe uma listagem desses valores. Esse 
resultado e significativo, F(l, 19) = 6,22, p 
< 0,05, o que contradiz o que foi encontrado 
usando os testes post hoc (veja a Saida 11.13 
do SPSS). Por que isso acontece? O proximo 
contraste compara o nivel 2 (vinho) com a 
categoria base (agua) e confirma a diferenga 
significativa encontrada com os testes post 
hoc, F{ 1, 19) = 18.61, p < 0,001. Para o efei- 
to principal da imagem, o primeiro contraste 
compara o nivel 1 (positiva) com a categoria 
base (a ultima categoria: neutra) e verifica a 
diferenga significativa encontrada com os tes¬ 
tes post hoc, F(l, 19) = 142,19, p < 0,001. 
O segundo contraste confirma a diferenga 
significativa nas avaliagoes encontradas na 
condigao da imagem negativa comparada com 
a neutra, F(l, 19) = 47,07, p < 0,001). Esses 
contrastes estao todos bem, mas eles nos di- 
zem somente o que ja sabemos (contudo, note 
o crescente poder estatistico com esses testes 
mostrado pelos altos valores de significancia). 
Os contrastes se tornam mais interessantes 
quando observamos o termo de interagao. 


11.9.5.1 Cerveja versus agua, percepgao 
positiva versus neutra © 

O primeiro termo da interagao compa¬ 
ra o nivel 1 de bebida (cerveja) com o nivel 
3 (agua) quando imagens positivas (nivel 1) 
sao utilizadas em comparagao com imagens 
neutras (nivel 3). Esse contraste nao e signifi¬ 
cativo. Esse resultado nos diz que o aumento 
da simpatia encontrado quando imagens po¬ 
sitivas sao usadas (comparadas com imagens 
neutras) e o mesmo tanto para cerveja ou 
agua. Em termos do grafico de interagao (Fi- 
gura 11.14) significa que a distancia entre o 
circulo e o triangulo na condigao da cerveja e 
a mesma do que a distancia entre o circulo e 
do triangulo na condigao da agua. Se apenas 
tragarmos essa segao do grafico de interagao, 
e facil ver que as linhas sao aproximadamente 
paralelas, indicando que nao ha efeito de inte¬ 
ragao. Podemos concluir que o aumento das 
avaliagoes devido as imagens positivas com¬ 
paradas as neutras nao e afetada se as pessoas 
estao avaliando a cerveja ou a agua. 



Tipo de Bebida 
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11.9.5.2 Cerveja versus Agua, Percepgao 
Negativa versus Neutra © 

O segundo termo de interagao compara o 
nfvel 1 de bebida (cerveja) ao nfvel 3 (agua) 
quando imagens negativas (nfvel 2) sao utili- 
zadas em comparagao a neutras (nfvel 3). Esse 
contraste e significativo, F(l, 19) = 6,75, p < 
0,05. Esse resultado nos diz que o decrescimo 
de simpatia encontrado quando imagens nega¬ 
tivas sao usadas (comparadas as imagens neu¬ 
tras) e diferente quando a cerveja e usada do 
que quando a agua e utilizada. Em termos de 
grafico de interagao (Figura 11.14), significa 
que a distancia entre o quadrado e o triangulo 
na condigao cerveja (uma diferenga pequena) 
e significativamente menor do que a distancia 
entre o quadrado e o triangulo na condigao da 
agua (uma diferenga maior). Podemos con- 
cluir que o decrescimo nas avaliagoes devido 
as imagens negativas (comparadas as neutras) 
encontrado quando agua e usada no comercial 
e menor do que quando a cerveja e utilizada. 


11.9.5.3 Vinho versus agua, percepgao 
positiva versus neutra © 

O terceiro termo de interagao avalia o nf¬ 
vel 2 da bebida (vinho) comparado ao nfvel 3 
(agua) quando imagens positivas (nfvel 1) sao 
usadas em comparagao a neutras (nfvel 3). 
Esse contraste nao e significativo, indicando 
que o aumento da simpatia quando imagens 
positivas sao usadas (comparadas as imagens 
neutras) e a mesma tanto para vinho quanto 
para agua. Em termos de interagao de grafico 
(Figura 11.14), significa que a distancia entre 
o cfrculo e o triangulo na condigao do vinho 
e a mesma da distancia entre o cfrculo e o tri¬ 
angulo na condigao da agua. Se apenas tragar- 
mos essa segao do grafico de interagao, e facil 
ver que as linhas sao paralelas, indicando um 
efeito sem interagao. Podemos concluir que 
o aumento das avaliagoes devido as imagens 
positivas comparadas as neutras nao e afetado 
pelo fato de as pessoas estarem avaliando o 
vinho ou a agua. 



Tipo de Bebida 
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11.9.5.4 Vinho versus agua, percepgao 
negativa versus neutra © 

O termo final das interagoes observa o nf- 
vel 2 da bebida (vinho) comparado ao nfvel 3 
(agua), quando imagens negativas (nfvel 2) sao 
usadas em comparagao a neutras (nfvel 3). Esse 
contraste e significativo, /•’( 1. 19) = 26,91,/? < 
0,001. Esse resultado nos diz que o decrescimo 
de simpatia encontrado quando imagens nega¬ 
tivas sao usadas (comparadas as imagens neu¬ 


tras) e diferente quando vinho e usado compa¬ 
rado com quando a agua e usada. Em termos de 
interagao no grafico (Figura 11.14), significa 
que a distancia entre o quadrado e o triangulo 
na condigao do vinho (uma diferenga grande) e 
significativamente maior do que a distancia en¬ 
tre o quadrado e triangulo na condigao da agua 
(uma diferenga menor). Podemos concluir que 
o decrescimo nas avaliagoes devido as imagens 
negativas (comparadas as neutras) e significati- 
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vamente maior quando o vinho e anunciado do 
que quando a agua e anunciada. 

11.9.5.5 Limitagoes desses contrastes © 

Esses contrastes, por sua natureza, nao nos 
dizem nada sobre as diferengas entre as con¬ 
digoes da cerveja e vinho (ou das condigoes 
positivas e negativas), e outros contrastes deve- 
rao ser feitos para descobrir mais. Entretanto, 
o que esta claro, ate agora, e que em relagao a 
condigao neutra imagens positivas aumentam 
para mais ou menos a simpatia pelos produ- 
tos sem levar em conta o produto; entretanto, 
imagens negativas tiveram um grande efeito 
no vinho e um efeito menor na cerveja. Essas 
diferengas nao foram previstas. Embora possa 
parecer cansativo gastar tanto tempo interpre- 
tando uma analise, e recomendavel adotar essa 
abordagem se voce realmente quer entender os 
efeitos obtidos. Interpretar termos de interagao 
e complexo, e eu conhego alguns pesquisadores 


bem respeitados que ainda tern dificuldade com 
isso, assim, nao fique desanimado se voce achar 
diffcil. Tente ser minucioso e analise cada efeito 
tanto quanto posslvel usando contrastes, e com 
sorte voce encontrara algum esclarecimento. 


11.10 TAMANHO DE EFEITO PARA A 
ANOVA FATORIAL DE MEDIDAS 
REPETIDAS ® 



Calcular o omega quadra- 
do para uma ANOVA de um 
fator de medidas repetidas foi 
de arrancar os cabelos, e eu 
continuo dizendo, tamanhos 
de efeito sao realmente mais uteis quando des- 
crevem um efeito focado - assim, aconselho 
calcular os tamanhos de efeito para os con¬ 
trastes quando voce tern um delineamento fa- 
torial (e qualquer efeito principal que compare 
somente dois grupos). A Saida 11.17 do SPSS 


/ - ; - 

Dica da Samanta Ferrinho 





V 


• A ANOVA de dois fatores de medidas repetidas compara muitas medias quan¬ 
do existem duas variaveis independentes e os mesmos participantes foram 
usados em todas as condigoes experimentais. 

• Teste a hipotese de esfericidade quando voce tern tres ou mais condigoes de 
medidas repetidas. Faga o teste de esfericidade usando o teste de Mauchly. 
Encontre a tabela com esse rotulo: se o valor na coluna denominada Sig. 
for menor do que 0,05, a hipotese foi violada. Se a significancia do teste de 
Mauchly e maior do que 0,05, a hipotese de esfericidade foi encontrada. Voce 
deve testar essa hipotese para todos os efeitos (numa ANOVA de dois fatores 
isso signifies testar para os efeitos das variaveis e o termo de interagao). 

• A tabela denominada Tests of Within-Subjects Effects mostra o resultado prin¬ 
cipal para sua ANOVA. Numa ANOVA de dois fatores voce tern tres efeitos: um 
efeito principal para cada variavel e a interagao entre as duas. Para cada efeito, 
se a hipotese de esfericidade foi encontrada, olhe para a linha denominada 
Sphericity Assumed. Se a hipotese foi violada, leia a linha denominada Gree- 
nhouse-Geiser (voce pode olhar Huynh-Feldt, mas voce deve ler este capitulo 
para descobrir os meritos relativos dos dois procedimentos). Tendo selecio- 
nado a linha apropriada, olhe para a coluna denominada Sig.: se o valor for 
menor do que 0,05, as medias dos grupos sao significativamente diferentes. 

• Analise os efeitos principals e termos de interagao usando contrastes. Esses 
contrastes aparecem na tabela denominada Tests of Within-Subjects Con¬ 
trasts; mais uma vez, olhe a coluna denominada Sig. para descobrir se suas 
comparagoes sao significativas (elas serao se o valor de significancia for me¬ 
nor do que 0,05). 

_ J 
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mostra os valores para varios contrastes, to- 
dos com graus de liberdade 1 para o modelo 
(isto e, eles representam uma comparagao fo- 
cada e interpretavel) e tem 19 graus de liber¬ 
dade residual. Podemos usar essas razoes F e 
converte-las para um tamanho de efeito r, 
usando o que ja vimos anteriormente: 


r = 


F(lgl R ) 

F(hgl R )+gl R 


Para as duas comparagoes que fizemos 
para a variavel bebida (Saida 11.17 do SPSS), 
vamos ter: 


' Cerveja vs. Agua ' 


' Vinho vs. Agua ' 


6,22 


6,22 + 19 

18,61 
18,61 + 19 


0,50 


0,70 


Portanto, ambas as comparagSes produ- 
zem tamanhos de efeito bem grandes. Para as 
duas comparagSes que fizemos para a variavel 
(Saida 11.17 do SPSS), temos: 


' Positiva vs. Neutra ' 


' Negativa vs. Neutra ' 


142,19 
142,19 + 19 


0,94 


47,07 
47,07 + 19 


= 0,84 


Novamente, ambas as comparagoes pro- 
duzem tamanhos de efeito muito grandes. Para 
o termo de interagao temos quatro contrastes, 
mas podemos converte-los em r porque todos 
tem 1 grau de liberdade para o modelo (Saida 
11.17 do SPSS): 


^Cerveja vs. agua, Positiva vs. Neutra 


^Cerveja vs. Agua, Negativa vs. Neutra 


^ Vinho vs. Agua, Positiva vs. Neutra 


^ Vinho vs. Agua, Negativa vs. Neutra 


1,58 


1,58 + 19 
6,75 

6,75 + 19 


0,24 


0,24 + 19 

26,91 
26,91 + 19 


0,28 


0,51 


0,11 


= 0,77 



Assim, os dois efeitos que 
eram significativos (cerveja 
versus agua, negativa versus 
neutra e vinho versus agua, ne¬ 
gativa versus neutra) produ- 
zem tamanhos de efeito muito grandes. Os 
dois efeitos que nao eram significativos pro- 
duziram um tamanho de efeito medio (cerveja 
versus agua, positiva versus neutra) e um ta¬ 
manho de efeito pequeno (vinho versus agua, 
positiva versus neutra). 


11.11 RELATAND0 OS RESULTAD0S DA 
AN0VA FAT0RIAL DE MEDIDAS 
REPETIDAS © 

Podemos relatar uma ANOVA fatorial de 
medidas repetidas da mesma forma que rela- 
tamos qualquer outra ANOVA. Lembre que te¬ 
mos tres efeitos para relatar e esses efeitos po- 
dem ter diferentes graus de liberdade. Para os 
efeitos principals de bebida e imagens, a hipo- 
tese de esfericidade foi violada e, assim, temos 
que relatar os graus de liberdade corrigidos de 
Greenhouse e Geisser. Podemos, portanto, co- 
megar relatando a violagao da esfericidade: 

/ O teste de Mauchly indica que a hipotese 
de esfericidade foi violada para o efeito 
principal da bebida x 2 (2) = 23,75, p < 
0,001 e imagem x 2 (2) = 7,42, p < 0,05. 
Portanto, os graus de liberdade foram cor¬ 
rigidos utilizando as estimativas de esferi¬ 
cidade de Greenhouse e Geisser (e = 0,58 
para o efeito principal da bebida e 0,75 
para o efeito principal da imagem). 

Podemos relatar os tres efeitos dessa ana- 
lise como segue: 

/ Todos os efeitos sao relatados como sig¬ 
nificativos em p < 0,05. Havia um efeito 
principal significativo do tipo de bebida 
nas avaliagoes da bebida, F(l,15, 21,93) 
= 5,11. Os contrastes revelaram que as 
avaliagoes para cerveja F(l, 19) = 6,22, r 
= 0,50 e vinho F(l,19) = 18,61, r = 0,70 
eram significativamente mais altos do que 
para a agua. 
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/ Houve, tambem, um efeito significativo do 
tipo de imagem na avalia^ao das bebidas, 
F(l,50, 28,40) = 122,57. Os contrastes re- 
velaram que as avaliacoes apos a cxibicao 
de imagens positivas foram significativa- 
mente maiores do que apos imagens neu- 
tras, F(l,19) = 142,19, r = 0,94. Ja apos 
imagens negativas elas foram significativa- 
mente mais baixas do que com as imagens 
neutras, F(l,19) = 47,07, r = 0,84. 

V Houve uma interacao significativa en- 
tre o tipo de bebida e o tipo de imagem 
usada, F( 4, 76) = 17.16. Isso indica que 
as imagens tinham diferentes efeitos nas 
avaliacoes das pessoas dependendo do 
tipo de bebida que foi usado. Para anali- 
sar essa interacao, contrastes foram reali- 
zados comparando todos os tipos de be¬ 
bidas a sua base (agua) e todos os tipos 
de imagens a sua base (imagens neutras). 
Esses contrastes revelaram i nteracoes sig- 
nificativas quando comparadas imagens 
negativas a imagens neutras tanto para 
a cerveja em relacao a agua, F( 1, 19) = 
6,75, r = 0,51, quanto para o vinho em re¬ 
lacao a agua, F(l, 19) = 26,91, r = 0,77. 
Observando o grafico de interacao, esses 
efeitos refletem que imagens negativas 
(comparadas as neutras) baixaram os es- 
cores significativamente mais para a agua 
do que para cerveja e baixaram os escores 
significativamente mais para o vinho do 
que para a agua. Os contrastes restantes 
nao revelaram termos de interacao sig- 
nificativos quando comparamos imagens 
positivas as imagens neutras para cerveja 
comparada a agua, F(l, 19) = 1,58, r = 
0,28 e para o vinho comparado a agua, 
F(l, 19) < 1, r = 0,11. Entretanto, esses 
contrastes produziram tamanhos de efeito 
pequenos para medios. 

11.12 0QUEDESC0BRIM0SS0BRE 
ESTATISTICA? © 

Este capftulo nos ajudou a entender os 
delineamentos das medidas repetidas. A pri- 
meira coisa que aprendemos foi que com os 


delineamentos de medidas repetidas existe, 
ainda, outra hipotese para nos preocuparmos: 
esfericidade. Tendo nos recuperado dessa re- 
velacao chocante, tivemos sorte de descobrir 
que essa hipotese, se violada, pode ser facil- 
mente remediada. Em seguida, analisamos 
a teoria da ANOVA para medidas repetidas 
para uma variavel de fator independente. Em- 
bora nao tenha sido essencial, esse foi um 
exercfcio util para demonstrar que aquela teo¬ 
ria e basicamente a mesma quando temos um 
delineamento independente (bem, existem 
algumas diferencas sutis, mas eu destaquei 
as semelhancas). Depois, vimos um exemplo 
no SPSS, antes de enfrentarmos o omega ao 
quadrado. Lamento ter entrado nesse assun- 
to, mas teimoso como sempre, perseverei. 
Isso nos levou a um delineamento fatorial de 
medidas repetidas e especificamente a situa- 
Cao onde temos 2 variaveis independentes. 
Aprendemos que, assim como com outros de¬ 
lineamentos fatoriais, temos que nos preocu- 
par com os termos de interacao. Mas tambem 
descobrimos algumas maneiras uteis de ana- 
lisar esses termos usando contrastes. Se voce 
pensou que tudo aquilo era ruim, irei acres- 
centar mais uma complicacao nessa mistura. 
Podemos combinar medidas repetidas e deli¬ 
neamentos independentes, e o proximo capf- 
tulo analisa essa situacao. Como se isso nao 
fosse ruim o suficiente, tambem mostrarei um 
delineamento com tres variaveis independen¬ 
tes (neste momento estou sentado na minha 
cadeira com os olhos vidrados babando e rin- 
do como um mamaco). 

11.13 TERM0S-CHAVE QUE 
DESCOBRIMOS 

• Simetria composta 

• Correcao de Greenhouse e Geisser 

• Correcao de Huynh e Feldt 

• Estimativas do limite inferior 

• Teste de Mauchly 

• ANOVA de medidas repetidas 

• Esfericidade 
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11.14 TAREFAS DO ALEX ESPERTO 

• Tarefa 1: Imagine que desejo 
observar o efeito que o alcool 
tem sobre um “olhar de cobiga”. 
O efeito “olhar de cobiga” e a 
tendencia das pessoas em rela- 
cionamentos de “conferir” o sexo oposto. 
Selecionei 20 homens e dei a eles oculos in- 
crivelmente sofisticados que poderiam ras- 
trear os movimentos dos seus olhos e gravar 
tanto o movimento dos seus olhos quanto o 
objeto sendo observado (esse e o ponto onde 
fica obvio que estou inventando tudo isso). 
Durante quatro noites forneci a essas pobres 
almas 1, 2, 3 ou 4 canecas de uma cerveja 
forte numa boate. A cada noite, mensurei 
quantas mulheres diferentes eles conferiam 
(uma mulher era considerada conferida se o 
homem a olhou da cabega aos pes a cabega 
novamente). Para validar essa medida, tam- 
bem coletei a quantidade de baba no queixo 
do homem enquanto estava olhando para 
uma mulher. Os dados estao no arquivo Ro- 
vingEye.sav; analise-os com uma ANOVA 
de um fator. © 

• Tarefa 2: No capftulo anterior, vimos o 
efeito alcool ( beer-goggles ): uma severa 
distorgao da percepgao apos beber grandes 
quantidades de alcool. A distorgao visual 
especffica e que pessoas anteriormente con- 
sideradas nao atraentes tornam-se bonitas. 
Resumindo, num minuto voce esta no zoo- 
logico admirando os orangotangos e no pro¬ 
ximo voce esta pensando por que alguem 
colocaria Gail Porter (ou seja la o nome 
que ela tem agora) numa j aula. De qualquer 
modo, naquele capftulo, um conjunto de 
dados descaradamente fabricado demons- 
trou que o efeito alcool era mais forte nos 
homens do que nas mulheres e fazia efeito 
somente apos 2 canecas de cerveja. Imagi¬ 
ne que queremos continuar com essas des- 
cobertas para observar em que fatores esse 
efeito interfere. Especificamente, achamos 
que o efeito alcool pode piorar pelo fato de 
que ele geralmente ocorre em boates com 


pouca luz. Pegamos uma amostra de 26 
homens (porque o efeito e mais forte nos 
homens) e demos a eles varias doses de 
alcool durante quatro semanas diferentes 
(nenhuma bebida, 2 canecas, 4 canecas e 6 
canecas de uma cerveja forte). Essa e a nos- 
sa primeira variavel independente, a qual 
chamaremos de consumo de alcool, e tem 
quatro nfveis. Cada semana (e, portanto, 
em cada estagio de embriaguez), eles irao 
selecionar uma acompanhante numa boate 
normal (que tenha pouca iluminagao) e, en- 
tao, selecionar uma segunda acompanhante 
numa boate especialmente escolhida que 
tenha otima iluminagao. Desse modo, a se¬ 
gunda variavel independente foi se o clube 
tinha pouca ou muita iluminagao. A safda 
da mensuragao foi a atratividade de cada 
acompanhante avaliada por um grupo de 
jufzes independentes. Recapitulando, todos 
os participantes tomaram parte em todos os 
nfveis na variavel de consumo do alcool e 
selecionaram as acompanhantes em boates 
com muita ou pouca iluminagao. Os dados 
estao no arquivo BeerGogglesLighting. 
sav; analise-os com uma ANOVA de dois 
fatores de medidas repetidas. © 

• Tarefa 3: Usando o Quadro 11.1, mude a 
sintaxe em SimpleEffectsAttitude.sps para 
observar o efeito de bebida em nfveis dife¬ 
rentes de imagens. © 
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ANOVA COM DELINEAMENTOS 

MISTOS (MLG 5) 


12.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 

O ultimo delineamento 
que vou abordar e um em 
que temos uma mistura de 
variaveis entre grupos e de 
medidas repetidas: um deli¬ 
neamento misto. Para ter 
esse delineamento, obvia- 
mente e necessario pelo me- 
nos duas variaveis independentes, mas voce 
pode ter cenarios mais complexos tambem (por 
exemplo, duas entre grupos e uma de medidas 
repetidas, uma entre grupos e duas de medidas 
repetidas ou, ate mesmo, duas de cada). O SPSS 
permite que voce teste quase todos os delinea- 
mentos que quiser, praticamente com qualquer 
grau de complexidade. Entretanto, se os termos 
de interagao sao diffceis de interpretar com ape- 
nas duas variaveis, entao imagine a dificuldade 
se incluirmos quatro! O melhor conselho que 
posso oferecer e permanecer com tres ou menos 
variaveis independentes se voce quiser conse- 
guir interpretar os termos de interagao 1 e, certa- 


1 Apreciadores de ironia irao gostar da ANOVA de qua¬ 
tro fatores que realizei em Field e Davey (1999) e em 
muitas outras puhlicacdcs! 


mente, nao utilizar mais do que quatro, a nao 
ser que queira uma bela dor de cabe^a. 

Este capitulo ira analisar um exemplo de 
uma. AN OVA mista. Nao havera teoria alguma 
porque voce definitivamente ja teve teoria su- 
ficiente sobre a ANOVA (voce pode interpre¬ 
tar isso como “E muito complexo para mim e 
eu irei disfarcar minha incompetencia fazen- 
do de conta que voce nao precisa saber sobre 
isso”). Vamos analisar um exemplo usando o 
SPSS e, depois, interpretar a saida. Com sorte, 
voce aprendera algo sobre intera^oes e como 
analisa-las utilizando contrastes. 

12.2 0 QUE HOMENS E MULHERES 
PROCURAM EM UM 
COMPANHEIRO? © 

O exemplo que iremos usar neste capitulo 
continua com o tema do namoro. Muitas revis¬ 
tas falam sobre como homens e mulheres que- 
rem coisas diferentes de um relacionamento (ou 
talvez seja so a revista Marie Claire da minha 
namorada, que nao leio - mesmo). A grande 
pergunta e: o que e mais importante, a aparencia 
ou a personalidade? Imagine que voce queira 
usar isso em um teste. Voce idealiza um piano 
engenhoso onde organiza uma noite de encon- 
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tros rapidos (speed dating)} Mai sabem as pes- 
soas que compareceram ao encontro que voce 
chamou alguns dos seus amigos como pares. 
Especificamente, voce colocou nove homens e 
nove mulheres para atuarem como pares. Em 
cada um desses grupos, tres pessoas eram ex- 
tremamente atraentes, mas diferiam em perso- 
nalidade: uma tinha muito carisma 2 3 , outra tinha 
pouco carisma e a terceira era tao entediante 
quanto este livro. Outras tres pessoas tinham 
uma atratividade mediana e diferiam, novamen- 
te, quanto a sua personalidade: uma era muito 
carismatica, a outra tinha um pouco de carisma 
e a terceira pessoa era muito chata. As tres ulti¬ 
mas eram, nao querendo ser indelicado, muito 
feias e, novamente, uma era carismatica, outra 
tinha pouco carisma e a ultima pobre alma era 
um tedio. Os participantes foram as pessoas que 
se interessaram por essa noite de “encontros ra¬ 
pidos” e durante toda a noite eles passaram por 
todas as nove pessoas do sexo oposto que foram 
selecionadas para eles. Apos uma conversa de 5 
minutos, eles avaliaram o quanto gostariam de 
ter um encontro de fato com a pessoa em uma 
escala percentual (100% = “Eu pagaria pelo seu 
telefone”, 0% = “Eu pagaria por uma passa- 
gem de aviao que me levasse para bem longe de 
voce”). Cada participante avaliou nove pessoas 
diferentes que variaram quanto a atratividade e 
personalidade. Assim, existem duas variaveis de 
medidas repetidas: looks (aparencia) (com tres 
nfveis, pois a pessoa pode ser atraente, mediana 
ou feia) e personality (personalidade) (nova¬ 
mente, com tres nfveis: muito carisma, pouco 


2 No caso dos encontros rapidos (speed dating) terem sa- 
l'do de moda e ninguem saber do que eu estou falando, 
a ideia basica e: muitos homens e mulheres se encon- 
trando em algum lugar (ou apenas homens ou apenas 
mulheres se for uma noite gay). Metade do grupo senta 
sozinho em pequenas mesas e o restante escolhe uma 
dessas mesas. Estes tern 3 minutos para impressionar a 
outra pessoa a mesa; quando o tempo acaba, uma cam- 
painha toca e eles se levantam e vao para outra mesa. 
Depois de passar por todas as mesas, os participantes 
terminam a noite ou perseguindo a pessoa que mais 
gostaram ou evitando algum excentrico. 

3 As pessoas muito atraentes e altamente carismaticas 
foram, e claro, jogadas de um penhasco porque a vida 
ja e dificil o suficiente sem essas pessoas em volta fa- 
zendo voce se sentir inadequado. 


carisma ou um tedio). Obviamente, as pessoas 
avaliando poderiam ser homens ou mulheres, 
assim, devemos tambem incluir o genero (ho- 
mem ou mulher); isso, e claro, sera uma variavel 
entre grupos. Os dados estao na Tabela 12.1. 

12.3 ANOVA MISTA NO SPSS © 

12.3.1 A analise principal © 

Para entrar com esses dados no SPSS, 
usamos o mesmo procedimento realizado na 
ANOVA de dois fatores de medidas repetidas 
que vimos no capftulo anterior. Lembre que 
cada linha no editor de dados representa os da¬ 
dos de um unico participante. Se a pessoa par- 
ticipar em todas as condigoes experimentais 
(nesse caso, elas passam por todas as pessoas 
que diferem em atratividade e todas as pessoas 
que diferem em carisma), cada condi§ao expe¬ 
rimental deve ser representada por uma coluna 
no editor de dados. Nesse experimento, exis¬ 
tem nove condigbes experimentais, assim, os 
dados precisam ser colocados em nove colunas 
(o formato e identico ao da Tabela 12.1). Por- 
tanto, crie as seguintes nove variaveis no editor 
de dados com os nomes conforme determina- 
do. Para cada uma, voce tambem deve entrar 
um nome completo de variavel (veja a Sefao 
2.4.2) para uma maior clareza na safda. 


att_high 

Attactive 

(Atraente) 

+ High Charisma 
(Muito carisma) 

avjiigh 

Average Looks 

(Aparencia 

mediana) 

+ High Charisma 

ug_high 

Ugly (Feio) 

+ High Charisma 

att_some 

Attractive 

+ Some Charisma 
(Pouco carisma) 

av_some 

Average Looks 

+ Some Charisma 

ug_some 

Ugly 

+ Some Charisma 

att_none 

Attractive 

+ Dullard (Chato) 

av_none 

Average Looks 

+ Dullard 

ug_none 

Ugly 

+ Dullard 


Depois que as variaveis foram criadas, entre 
com os dados conforme apresentado na Tabela 
12.1. Se voce tiver problemas para digitar os da- 
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Tabela 12.1 Dados de LooksOrPersonality.sav (Att = Atraente, Av = Mediano, Ug = Feio) 


Aparencia 

Muito Carisma 

Pouco Carisma 


Chato 


Att 

Av 

Ug 

Att 

Av 

Ug 

Att 

Av 

Ug 

Homem 

86 

84 

67 

88 

69 

50 

97 

48 

47 


91 

83 

53 

83 

74 

48 

86 

50 

46 


89 

88 

48 

99 

70 

48 

90 

45 

48 


89 

69 

58 

86 

77 

40 

87 

47 

53 


80 

81 

57 

88 

71 

50 

82 

50 

45 


80 

84 

51 

96 

63 

42 

92 

48 

43 


89 

85 

61 

87 

79 

44 

86 

50 

45 


100 

94 

56 

86 

71 

54 

84 

54 

47 


90 

74 

54 

92 

71 

58 

78 

38 

45 

Mulher 

89 

86 

63 

80 

73 

49 

91 

48 

39 


89 

91 

93 

88 

65 

54 

55 

48 

52 


84 

90 

85 

95 

70 

60 

50 

44 

45 


99 

100 

89 

80 

79 

53 

51 

48 

44 


86 

89 

83 

86 

74 

58 

52 

48 

47 


89 

87 

80 

83 

74 

43 

58 

50 

48 


80 

81 

79 

86 

59 

47 

51 

47 

40 


82 

92 

85 

81 

66 

47 

50 

45 

47 


97 

69 

87 

95 

72 

51 

45 

48 

46 


95 

92 

90 

98 

64 

53 

54 

53 

45 


95 

93 

96 

79 

66 

46 

52 

39 

47 


dos, use o arquivo LooksOrPersonality.sav. Pri- 
meiro temos que definir nossas variaveis de me- 
didas repetidas, assim, acesse a caixa de dialogo 
define factors (definir fatores) usando o menu 
Analyze=>General Linear Model=>Repeated 
Measures... (Analisar=>Modelo Linear Ge- 
ral=>Medidas Repetidas...). Da mesma forma 
que com a ANOVA de dois fatores de medidas 
repetidas (veja o capftulo anterior), precisamos 
nomear as nossas variaveis de medidas repeti¬ 
das e especificar quantos mveis cada uma tem. 
Nesse caso, existem dois fatores entre sujeitos: 
looks (aparencia) (atraente, mediano ou feio) 
e charisma (carisma) (muito carisma, pouco 
carisma e chato). Na caixa de dialogo define 
factors, troque a palavra factor 1 pela palavra 
looks. Quando voce tiver dado a esse fator de 
medidas repetidas um nome, diga ao computa- 
dor que essa variavel tem tres mveis digitando 
o numero 3 dentro da caixa Number of Levels 
(Numero de nfveis). Clique em M (adicio- 


nar) para incluir essa variavel na lista de varia¬ 
veis de medidas repetidas; ela ira aparecer no 
quadro em branco no final da caixa de dialogo 
como looks (3) (aparencia). Agora, repita esse 
processo com a segunda variavel independente 
Insira a palavra charisma no espago rotulado 
Within-Subject Factor Name e entao, devido 
aos 3 mveis dessa variavel, insira o numero 3 
no espaco rotulado Number of Levels. Clique 
em **■ (incluir) para incluir essa variavel na 
lista de fatores, que aparecera como charisma 
(3). A caixa de dialogo completa e apresentada 
na Figura 12.1. Depois de entrar com ambos os 
fatores dentre sujeitos, clique em (Definir) 
para ir a caixa de dialogo principal. 

A caixa de dialogo principal e a mesma 
de quando fizemos a ANOVA fatorial de me¬ 
didas repetidas no capftulo anterior (veja a Fi¬ 
gura 12.2). No alto da caixa Within-Subjects 
Variables (Variaveis entre participantes), o 
SPSS afirma que existem dois fatores: looks 
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Figura 12.1 Caixa de dialogo define factors 
(definir fatores) para a ANOVA de medidas re- 
petidas. 

e charisma. Na caixa abaixo, existe uma serie 
de pontos de interrogacao seguidos por nume- 
ro entre parenteses. Os numeros entre paren- 
teses representam os niveis dos fatores (varia- 
veis independentes) - veja o capitalo anterior 
para uma explicagao mais detalhada. 

Nesse exemplo, existem duas variaveis in¬ 
dependentes, portanto, existem dois numeros 
nos parenteses. O primeiro numero se refere aos 
niveis do primeiro fator listado abaixo do quadro 
(nesse caso, looks). O segundo numero se refe¬ 
re aos niveis do segundo fator acima do quadro 
(nesse caso, charisma). Assim como na outra 
ANOVA de medidas repetidas que vimos, preci- 
samos substituir os pontos de interrogagao pelas 
variaveis listadas no quadro esquerdo da caixa 


de dialogo. No delineamento entre grupos, em 
que codigos variaveis sao usados, os niveis de 
um fator particular sao especiftcados pelos co¬ 
digos designados a eles no editor de dados. En- 
tretanto, em um delineamento de medidas repe¬ 
tidas, esse esquema de codigos nao e utilizado, 
desse modo, determinamos que condigao atri- 
buir a um nivel nesse estagio (novamente, retor- 
ne ao capitulo anterior para mais informagoes). 
Por isso, e imperativo que pensemos sobre o tipo 
de contrastes que queremos fazer antes de en- 
trar com as variaveis na caixa de dialogo. Nesse 
experimento, se observarmos a primeira varia- 
vel, looks, veremos que existem tres condicoes: 
atraente, mediano e feio. De certo modo, faz 
sentido comparar as condigoes atraente e feio a 
mediano porque uma pessoa mediana representa 
a maioria (embora nao fosse errado comparar, 
por exemplo, atraente e mediana a categoria 
feia). Essa comparagao pode ser feita especifi- 
cando um contraste simples (veja a Tabela 8.6), 
desde que tenhamos certeza de que a categoria 
mediana seja codificada como nossa primeira ou 
ultima categoria. Agora, vamos pensar sobre o 
nos so segundo fator. O fator charisma tambem 
tern uma categoria que representa a maioria, que 
e ter pouco carisma. Novamente, podemos usar 
isso como um controle para a comparagao dos 
nossos dois extremos (muito carisma e chato). 
Portanto, podemos conduzir um contraste sim- 



Figura 12.2 Definigao dos niveis dos fatores para a ANOVA de medidas repetidas. 
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pies comparando todas as categorias com a de 
pouco carisma; isso precisa ser colocado como 
o primeiro ou como o ultimo nfvel. 

Com base no que foi discutido sobre o uso 
de contrastes, faz sentido ter a categoria mediana 
como o rnvel 3 do fator looks e pouco carisma 
como o terceiro rnvel do fator charisma. Os 
nfveis restantes podem ser decididos arbitraria- 
mente. Escolhi atraente como nfvel 1 e feio como 
mvel 2 do fator looks. Para a variavel charisma, 
escolhi muito carisma como nfvel 1 e chato 
como nfvel 2. Essas decisoes significam que as 
variaveis devem entrar da seguinte forma: 


att_high 

3 


att_none 

3 

_?_(!, 2) 

att_some 

3 

_?_(!, 3) 

ug_high 

3 

_?_(2,1) 

ug_none 

3 

_?_(2,2) 

ug_some 

3 

_?_(2,3) 

av_high 

3 

_?_(3,1) 

av_none 

3 

_?_(3,2) 

av_some 

3 

_?_(3,3) 


Diferentemente do capftulo anterior, tro- 
quei a ordem de entradas das variaveis no edi¬ 
tor de dados. Fiz isso apenas para ilustrar que 
podemos entrar com as variaveis na ordem que 
quisermos. Ate agora, o procedimento tern sido 
similar aos dos demais delineamentos de me- 
didas repetidas. Entretanto, temos um delinea- 
mento misto aqui, desse modo, precisamos es- 
pecificar ainda o fator entre grupos. Para fazer 
isso, selecione gender (genero) na lista de va¬ 
riaveis e clique em 3 a fim de transferi-la para 
o quadro Between-Subjects Factors (Fatores 
entre participantes). A caixa de dialogo com- 
pleta deve ser parecida com a da Figura 12.3. Ja 
discuti as opqoes para os botoes na parte de bai- 
xo da caixa de dialogo, assim, falarei somente 
daqueles importantes para esse exemplo. 

12.3.2 Outras opcoes © 

Depois da analise principal, e interessante 
comparar os nfveis das variaveis independentes 
para ver no que elas diferem. Como vimos, nao 
existe um recurso para entrar com os codigos 
dos contrastes (a nao ser que voce use a sintaxe), 
portanto, temos que contar com os contrastes 



Figura 12.3 Caixa de dialogo completa para a ANOVA de delineamento misto. 
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Figura 12.4 Contrastes para a ANOVA de de- 
lineamentos mistos. 

disponfveis (veja a Tabela 8.6). A Figura 12.4 
mostra a caixa de dialogo para conduzir contras¬ 
tes e e obtida clicando em l go ""‘ ,a (Contrastes) na 
caixa de dialogo principal. Na segao anterior, ex- 
pliquei por que e interessante usar as condigoes 
atratividade mediana e pouco carisma como ca- 
tegorias base para os fatores looks e charisma, 
respectivamente. Usamos a caixa de dialogo 
contrasts (Contrastes) antes, nas Segoes 9.3.3 e 
11.4.2, assim, apenas direi que voce deve sele- 
cionar um contraste simples para cada variavel 
independente. Para ambas variaveis independen- 
tes, entramos com as variaveis de tal forma que a 
categoria de controle era a ultima, portanto, nao 
precisamos trocar a categoria de referenda para 
o contraste simples. Depois que os contrastes 
forem selecionados, clique em c -""- (continuar) 
para retornar a caixa de dialogo principal. 

Gender (genero) tem somente dois nfveis 
(masculino ou feminino), portanto, nao preci¬ 
samos especificar contrastes para essa variavel. 
A adigao do fator entre grupos tambem signifi- 
ca que podemos selecionar testes post hoc para 
essa variavel clicando em PotlHoi; . Essa agao 
apresenta a caixa de dialogo testes post hoc 
(veja a Segao 8.3.3), que pode ser usada como 
explicado anteriormente. Entretanto, nao preci¬ 
samos especificar um teste post hoc aqui porque 
o fator entre grupos tem somente dois nfveis. 

Com a adigao de uma variavel extra, e ne- 
cessario escolher um grafico diferente daquele 
do exemplo capftulo anterior. Clique em P|01 * 
(Diagramas) para acessar uma caixa de dialogo 
semelhante a da Figura 12.5. Coloque looks 
no espaco Horizontal Axis (Eixo horizontal) e 



Figura 12.5 Caixa de dialogo diagramas (plots) 
para a ANOVA mista de tres fatores. 

charisma no espago Separate Line (Linha se- 
parada); finalmente, coloque gender no espaco 
Separate Plots (Diagramas separados). Quan- 
do as tres variaveis forem especificadas, nao 
se esquega de clicar em **■ (adicionar) para 
acrescentar essa combinacao a lista dos dia¬ 
gramas. Solicitando ao SPSS para tragar a in- 
teragao looks x charisma x gender, teremos o 
grafico de interagao para looks e charisma, mas 
uma versao separada desse grafico sera produ- 
zida para participantes homens e mulheres. 

No que se refere as outras opgoes, voce deve 
selecionar as mesmas que foram escolhidas para 
o exemplo anterior (veja a Segao 11.8.4). Vale 
a pena selecionar medias marginais estimadas 
para todos os efeitos (porque esses valores irao 
ajuda-lo a entender qualquer efeito significati¬ 
ve), mas para economizar espago, nao solicitei 
intervalos de confianga para esses efeitos por¬ 
que ja vimos, com alguns detalhes, essa parte 
da safda. Quando todas as opgoes apropriadas 
forem selecionadas, execute a analise. 

12.4 SAIDAS PARA A ANOVA MISTA 
FATORIAL: ANALISE PRINCIPAL (D 

A safda inicial e a mesma do exemplo da 
ANOVA de dois fatores: existe uma tabela 
listando as variaveis de medidas repetidas do 
editor de dados e o nfvel de cada variavel in- 
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dependente que elas representam. A segunda 
tabela contem estatfsticas descritivas (medias e 
desvios padrao) para cada uma das nove condi- 
qoes divididas entre homens ou mulheres (veja 


a Saida 12.1 do SPSS). Os nomes nessa tabela 
sao os que dei as variaveis no editor de dados 
(portanto, sua safda pode diferir da minha). 
Essas estatfsticas descritivas sao interessantes 


Saida 12.1 do SPSS 

Within-Subjects Factors (Fatores entre Participantes) 


Measure: MEASUREJ (Medida: MEDIDA1) 


LOOKS CHARISMA 

(Aparencia) (Carisma) 

Dependent Variable 
(Variavel Dependente) 

i i 

2 

3 

ATT_HIGH (Muito Atraente) 
ATT_NONE (Nada Atraente) 
ATT_SOME (Pouco Atraente) 

2 1 

2 

3 

UGJilGH (Muito Feio) 

UGJVONE (Nada Feio) 

UG_SOME (Pouco Feio) 

3 1 

2 

3 

AV HIGH (Muito Mediano) 

AV_NONE (Nada Mediano) 
AV_SOME (Pouco Mediano) 


Descriptive Statistics (Estatisticas Descritivas) 


Gender (Genera) 

Mean 

(Media) 

Std. Deviation 
(Desvio padrao) 

N 

Attractive and High Charismatic (Atraente e 

Male (Masculino) 

88.30 

5.697 

10 

Muito Carismatico) 

Female (Feminino) 

89.60 

6.637 

10 


Total (Total) 

88.95 

6.057 

20 

Attractive and Dullard (Atraente e Chato) 

Male (Masculino) 

87.30 

5.438 

10 


Female (Feminino) 

51.80 

3.458 

10 


Total (Total) 

69.55 

18.743 

20 

Attractive and Some Charisma (Atraente e 

Male (Masculino) 

88.50 

5.740 

10 

Pouco Carismatico) 

Female (Feminino) 

87.10 

6.806 

10 


Total (Total) 

87.80 

6.170 

20 

Ugly and Highly Charismatic (Feio e Muito 

Male (Masculino) 

56.80 

5.731 

10 

Carismatico) 

Female (Feminino) 

86.70 

5.438 

10 


Total (Total) 

71.75 

16.274 

20 

Ugly and Dullard (Feio e Chato) 

Male (Masculino) 

45.80 

3.584 

10 


Female (Feminino) 

46.10 

3.071 

10 


Total (Total) 

45.95 

3.252 

20 

Ugly and Some Charisma (Feio e Pouco 

Male (Masculino) 

48.30 

5.376 

10 

Carismatico) 

Female (Feminino) 

51.20 

5.453 

10 


Total (Total) 

49.75 

5.476 

20 

Average and Highly Charismatic (Mediano e 

Male (Masculino) 

82.80 

7.005 

10 

Muito Carismatico) 

Female (Feminino) 

88.40 

8.329 

10 


Total (Total) 

85.60 

8.022 

20 

Average and Dullard (Mediano e Chato) 

Male (Masculino) 

47.80 

4.185 

10 


Female (Feminino) 

47.00 

3.742 

10 


Total (Total) 

47.40 

3.885 

20 

Average and Some Charisma (Mediano e 

Male (Masculino) 

71.80 

4.417 

10 

Pouco Carismatico) 

Female (Feminino) 

68.90 

5.953 

10 


Total (Total) 

70.35 

5.314 

20 
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porque elas nos mostram o padrao das medias 
atraves das condigoes experimentais (assim, 
usamos essas medias para produzir os graficos 
da interagao de tres fatores). 

A Saida 12.2 do SPSS mostra os resulta- 
dos do teste de esfericidade de Mauchly para 
cada um dos tres efeitos de medidas repetidas 
no modelo. Nenhum dos efeitos viola a hipo- 
tese de esfericidade porque todos os valores 
na coluna denominada Sig. estao acima de 
0,05; portanto, podemos assumir esfericidade 
quando olhamos as nossas estatisticas F. 

A Saida 12.3 do SPSS mostra a tabela 
resumo dos efeitos das medidas repetidas na 
ANOVA com os valores F corrigidos. Assim 
como com a ANOVA fatorial de medidas re¬ 
petidas, a saida e dividida em segoes para cada 
um dos efeitos no modelo e seus termos erro 
associados. A unica diferenga e que as intera- 
coes entre nossa variavel de genero entre gru- 
pos e os efeitos de medidas repetidas tambem 
estao incluidos. 

Novamente, precisamos olhar a coluna 
Sig. e, se os valores nessa coluna sao menores 
do que 0,05 para um efeito particular, entao 
ele e estatisticamente significativo. Exami- 
nando a tabela a partir do topo, encontramos 
um efeito significativo de looks, informando 
que se ignorarmos que o acompanhante era 
carismatico e se a avaliagao foi de um homem 


ou uma mulher, a atratividade de uma pessoa 
afetou significativamente as avaliagoes que 
eles receberam. A interagao looks x gender 
tambem e significativa, significando que a 
maneira como as avaliagoes foram afetadas 
pela atratividade foi diferente para avaliadores 
homens e mulheres. 

A seguir, encontramos um efeito signifi¬ 
cativo de carisma, informando que se ignorar¬ 
mos que o acompanhante era atraente e se a 
avaliagao era de um homem ou uma mulher, o 
carisma de uma pessoa significativamente afe¬ 
tou as avaliagoes que ela recebeu. A interagao 
charisma x gender e, tambem, significativa, 
assim, a maneira como as avaliagoes foram 
afetadas pelo carisma foi diferente entre ava¬ 
liadores homens e mulheres. 

Em seguida, encontramos uma interagao 
significativa entre looks e charisma, mostran- 
do que se ignorarmos o genero do avaliador, 
o perfil das avaliagoes atraves dos diferentes 
niveis de atratividade foi diferente para acom- 
panhantes muito carismaticos, acompanhan- 
tes pouco carismaticos e chatos. (O contrario 
tambem e verdadeiro: o perfil das avaliagoes 
atraves de diferentes niveis de carisma foi 
diferente para acompanhantes atraentes, me- 
dianos e feios). Para nos confundirmos ainda 
mais, a interagao looks x charisma x gender 
tambem e significativa, mostrando que looks 


Saida do SPSS 12.2 

(Mauchly's Test of Sphericity 3 (Teste de Mauchly da Esfericidade) 


Measure: MeasureJ (Medida: Medidal) 


Within-Subjects 
Effect (Efeito dentre 
participantes) 

Mauchiy's 
W(W de 
Mauchly) 

Approx. Chi-Square 
(Qui-Quadrado 
Aproximado) 

df 

(gi) 

Sig. 

(Sig.) 

Epsilon b 

Greenhouse- 

Geisser 

Huynh- 

Feldt 

Lower- 
bound 
(Li mite 
inferior) 

LOOKS (Aparencia) 

0.960 

0.690 

2 

0.708 

0.962 

1.000 

0.500 

CHARISMA (Carisma) 

0.929 

1.246 

2 

0.536 

0.934 

1.000 

0.500 

LOOKS* CHARISMA 

0.613 

8.025 

9 

0.534 

0.799 

1.000 

0.250 

(Aparencia*Carisma) 









Testa a hipotese nula de que a matriz de covariancia dos erros das variaveis dependentes transformadas e ortonormaliza- 
das e proporcional a uma matriz identidade. 

a Pode ser utilizado para ajustar os graus de liberdade dos testes de significance para medias. Os testes corrigidos sao 
mostrados em camadas (por padrao) na tabela dos testes de efeitos dentre participantes. 
b Delineamento: Intercepto + GENERO. 

Delineamento dentre participantes: APARENCIA + CARISMA + APARENCIA*CARISMA. 
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Saida 12.3 do SPSS 

Tests of Within-Subjects Effects (Testes de Efeitos entre Participantes) 


Measure: MEASURE_1 (Medida: MEDIDA1) 




Tipe III Sum of 


Mean 





Squares (Soma 


Square 





dos Quadrados 


(Media dos 



Source (Fonte) 


do Tipo III) 

ctf (gi) 

Quadrados) 

F 

Sig. 

LOOKS (Aparencia) 

Sphericity Assumed (Esferici- 

20779.633 

2 

10389.817 

423.733 

0.000 


dade Assumida) 
Greenhouse-Geisser 

20779.633 

1.923 

10803.275 

423.733 

0.000 


Huynh-Feldt 

20779.633 

2.000 

10389.817 

423.733 

0.000 


Lower-bound (Limite Inferior) 

20779.633 

1.000 

20779.633 

423.733 

0.000 

LOOKS * GENDER 

Sphericity Assumed (Esferici- 

3944.100 

2 

1972.050 

80.427 

0.000 

(Aparencia * Genero) 

dade Assumida) 
Greenhouse-Geisser 

3944.100 

1.923 

2050.527 

80.472 

0.000 


Huynh-Feldt 

3944.100 

2.000 

1972.050 

80.427 

0.000 


Lower-bound (Limite Inferior) 

3944.100 

1.000 

3944.100 

80.427 

0.000 

Error(LOOKS) 

Sphericity Assumed (Esferici- 

882.711 

36 

24.520 



(Erro(Aparencia)) 

dade Assumida) 
Greenhouse-Geisser 

882.711 

34.622 

25.496 




Huynh-Feldt 

882.711 

36.000 

24.520 




Lower-bound (Limite Inferior) 

882.711 

18.000 

49.040 



CHARISMA (Carisma) 

Sphericity Assumed (Esferici- 

23233.600 

2 

11616.800 

328.250 

0.000 


dade Assumida) 
Greenhouse-Geisser 

23233.600 

1.868 

12437.761 

328.250 

0.000 


Huynh-Feldt 

23233.600 

2.000 

11616.800 

328.250 

0.000 


Lower-bound (Limite Inferior) 

23233.600 

1.000 

23233.600 

328.250 

0.000 

CARISMA * GENDER 

Sphericity Assumed (Esferici- 

4420.133 

2 

2210.067 

62.449 

0.000 

(Carisma * Genero) 

dade Assumida) 
Greenhouse-Geisser 

4420.133 

1.868 

2366.252 

62.449 

0.000 


Huynh-Feldt 

4420.133 

2.000 

2210.067 

62.449 

0.000 


Lower-bound (Limite Inferior) 

4420.133 

1.000 

4420.133 

62.449 

0.000 

Error(CHARISMA) 

Sphericity Assumed (Esferici- 

1274.044 

36 

35.390 



(Erro(CARISMA)) 

dade Assumida) 
Greenhouse-Geisser 

1274.044 

33.624 

37.891 




Huynh-Feldt 

1274.044 

36.000 

35.390 




Lower-bound (Limite Inferior) 

1274.044 

18.000 

70.780 



LOOKS * CARISMA 

Sphericity Assumed (Esferici- 

4055.267 

4 

1013.817 

36.633 

0.000 

(Aparencia * Carisma) 

dade Assumida) 
Greenhouse-Geisser 

4055.267 

3.197 

1268.295 

36.633 

0.000 


Huynh-Feldt 

4055.267 

4.000 

1013.817 

36.633 

0.000 


Lower-bound (Limite Inferior) 

4055.267 

1.000 

4055.267 

36.633 

0.000 

LOOKS * CHARISMA 

Sphericity Assumed (Esferici- 

2669.667 

4 

667.417 

24.116 

0.000 

* GENDER (Aparen- 

dade Assumida) 






cia* Carisma * Genero) 

Greenhouse-Geisser 

2669.667 

3.197 

834.945 

24.116 

0.000 


Huynh-Feldt 

2669.667 

4.000 

667.417 

24.116 

0.000 


Lower-bound (Limite Inferior) 

2669.667 

1.000 

2669.667 

24.116 

0.000 

ErrorfLOOKS * CARIS- 

Sphericity Assumed (Esferici- 

1992.622 

72 

27.675 



MA) (Erro(Aparencia * 

dade Assumida) 






Carisma)) 

Greenhouse-Geisser 

1992.622 

57.554 

34.622 




Huynh-Feldt 

1992.622 

72.000 

27.675 




Lower-bound (Limite Inferior) 

1992.622 

18.000 

110.701 
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x charisma foi significativamente diferente 
em participantes homens e mulheres! 

Isso e muito para se assimilar, assim, ire- 
mos analisar esses efeitos em partes nas pro- 
ximas secoes. Primeiro, precisamos entender 
o que aconteceu com nosso efeito principal 
de genero. 

12.4.1 0 efeito de genero © 

O efeito principal do genero esta listado 
separadamente dos efeitos de medidas re- 
petidas em uma tabela denominada Tests of 
Between-Subjects Effects (Testes dos efeitos 
entre sujeitos). Antes de olharmos para essa 
tabela, e importante checar as hipoteses de ho- 
mogeneidade da variancia usando o teste de 
Levene (veja a Segao 3.6). 

O SPSS produz uma tabela listando o tes¬ 
te de Levene para cada uma das variaveis de 
medidas repetidas no editor de dados e deve- 


mos procurar por qualquer variavel que tenha 
um valor significativo. A Saida 12.4 do SPSS 
mostra ambas as tabelas. A tabela mostrando 
o teste de Levene indica que as variancias sao 
homogeneas para todos os niveis das variaveis 
de medidas repetidas (porque todos os valores 
de significancia sao maiores do que 0,05). Se 
qualquer valor fosse significativo, isso poderia 
comprometer a precisao do teste F para genero 
e teriamos que considerar a transfcrmagao de 
todos os nossos dados para a estabilizagao das 
variancias entre grupos (veja o Capitulo 3). 
Felizmente, nesse exemplo a transformagao 
nao e necessaria. A segunda tabela mostra o 
resumo da ANOVA para o efeito principal do 
genero e isso revela um efeito nao-significati- 
vo (porque a significancia de 0,946 e maior do 
que o ponto de corte padrao de 0,05). 

Podemos relatar que houve um efeito 
principal nao-significativo (ns) de genero, 


Saida 12.4 do SPSS 


Levene's Test of Equality of Error Variances a 
(Teste de Levene da Igualdade das Variancias do Erro) 



F 

dfl 

(gib 

df2 

(gis2) 

Sig. 

Attractive and High Charismatic (Atraente e Muito Carismatico) 

1.131 

1 

18 

0.302 

Attractive and Dullard (Atraente e Chato) 

1.949 

1 

18 

0.180 

Attractive and Some Charisma (Atraente e pouco Carismatico) 

0.599 

1 

18 

0.449 

Ugly and Highly Charismatic (Feio e Muito Carismatico) 

0.005 

1 

18 

0.945 

Ugly and Dullard (Feio e Chato) 

0.082 

1 

18 

0.778 

Ugly and Some Charisma (Feio e pouco Carismatico) 

0.124 

1 

18 

0.729 

Average and Highly Charismatic (Mediano e Muito Carismatico) 

0.102 

1 

18 

0.753 

Average and Dullard (Mediano e Chato) 

0.004 

1 

18 

0.950 

Average and Some Charisma (Mediano e com Pouco Carismatico) 

1.763 

1 

18 

0.201 


Testa a hipotese nula de que a variancia do erro da variavel dependente e igual ao longo dos grupos. 
a Delineamento: Intercepto + GENERO. 

Delineamento dentre participantes: APARENCIA + CARISMA + APARENCIA*CARISMA. 


Tests of Within-Subjects Effects (Testes de Efeitos dentre Participantes) 

Measure: MEASURE_1 (Medida: MEDIDA1) 

Transformed Variable: Average (Variavel transformada: Mediano) 


Source (Fonte) 

Tipe III Sum of 
Squares (Soma dos 
Quadrados do Tipo III) 

c If 
(gi) 

Mean Square 
(Media dos 
Quadrados) 

F 

Sig. 

Intercept (Intercepto) 
GENDER (Genero) 

Error (Erro) 

94027.756 

0.022 

84.469 

1 

1 

18 

94027.756 

0.022 

4.693 

20036.900 

0.005 

0.000 

0.946 
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F(l, 18) < 1, ns. Esse efeito nos diz que se 
ignorarmos todas as outras variaveis, as ava- 
liagoes dos participantes masculinos foram 
basicamente iguais as dos participantes femi- 
ninos. Se voce solicitou que o SPSS mostrasse 
as medias para o efeito do genero, deve exa- 
minar a saida para encontrar a tabela na se- 
gao chamada de Estimated Marginal Means 
(Medias marginais estimadas). A Saida 12.5 
do SPSS e uma tabela de medias para o efeito 
principal do genero com os erros padrao asso- 
ciados. Essa informagao e mostrada na Figura 


12.6. A partir desse grafico, fica claro que as 
avaliagoes de homens e mulheres foram em 
geral as mesmas. 

12.4.2 0 efeito da aparencia © 

Vimos o efeito principal da aparencia 
(looks) na Saida 12.3 do SPSS. Agora iremos 
ver o que esse efeito significa. Podemos relatar 
que havia um efeito principal significativo da 
aparencia (looks), F( 2, 36) = 423,73, p < 0,001. 
Esse efeito nos diz que se ignorarmos todas as 


Saida 12.5 do SPSS 


1 Gender (Genero) 


Measure: MEASUREJ (Medida: MEDIDA1) 





95% Confidence Interval (Intervalo de 95% de confian$a) 


Mean 

Std. Error 

Lower Bound 

Upper Bound 

Gender (Genero) 

(Media) 

(Erro Padrao) 

(Limite Inferior) 

(Limite Superior) 

Male (Masculino) 

68,600 

0,685 

67,161 

70,039 

Female (Feminino) 

68,533 

0,685 

67,094 

69,973 



Genero 


Figura 12.6 Diagrama de Barras de Erro para Genero mostrando um 1C de 95% para a media. 
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outras variaveis, as avaliagoes foram diferentes 
para os acompanhantes atraentes, medianos e 
feios. Se solicitarmos ao SPSS a exibicao das 
medias para o efeito aparencia (de agora em 
diante, suporei que voce fez isso), voce encon- 
trara a tabela na segao denominada Estimated 
Marginal Means (Medias marginais estima- 
das). A Saida 12.6 do SPSS e uma tabela de me¬ 
dias para o efeito principal da aparencia com os 
erros padrao associados. Os nfveis da aparencia 
estao rotulados de 1, 2 e 3, e voce deve lembrar 
como entrou com a variavel (ou voce pode olhar 
a tabela resumo que o SPSS produz no infcio 
da safda - veja a Saida 12.1 do SPSS). Se voce 
seguiu o que eu fiz, o nfvel 1 e atraente, o nfvel 
2 e feio e o mvel 3 e mediano. Para facilitar, essa 
informagao esta apresentada na Figura 12.7. 
Voce pode ver que a medida que a atrativida- 
de diminui, a media das avalia^oes tambem cai. 
Assim, esse efeito principal parece refletir que 
os avaliadores tinham maior probabilidade de 


Saida do SPSS 12.6 

2 Looks (Aparencia) 


Measure: MEASUREJ (Medida: MEDIDA1) 


Looks 

(Aparencia) 

Mean 

(Media) 

Std. 

Error 

(Erro 

Padrao) 

95% Confidence 
Interval (Intervalo de 
95% de confianQa) 

Lower 

Bound 

(Limite 

Inferior) 

Upper 

Bound 

(Limite 

Superior) 

i 

82.100 

0.652 

80.729 

83.471 

2 

55.817 

0.651 

54.449 

57.184 

3 

67.783 

0.820 

66.061 

69.505 


expressar um grande interesse em sair com pes- 
soas atraentes do que medianas ou feias. Entre- 
tanto, precisamos olhar alguns contrastes para 
descobrir exatamente o que esta acontecendo. 

A Safda 12.7 do SPSS mostra os contras¬ 
tes que solicitamos. Por enquanto, apenas olhe 



Atraente Mediano Feio 

Atratividade 


Figura 12.7 Diagrama de Barras de Erro para a Atratividade mostrando um 1C de 95% para a 
media. 
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Saida 12.7 do SPSS 

Tests of Within-Subjects Contrasts (Testes de Contrastes entre Participantes) 


Measure: MEASURE_1 (Medida: MEDIDA1) 





Tipe III Sum of 


Mean 






Squares (Soma 


Square 





CHARISMA 

dos Quadrados 

df 

(Media dos 



Source (Fonte) 

LOOKS (Aparencia) 

(Carisma) 

do Tipo III) 

(gi) 

Quadrados) 

F 

Sig. 

LOOKS (Aparencia) 

Level 1 vs. Level 3 
(Nivel 1 vs. Nivel 3) 


4099.339 

1 

4099.339 

226.986 

0.000 

Level 2 vs. Level 3 
(Nivel 1 vs. Nivel 3) 

2864.022 

1 

2864.022 

160.067 

0.000 

LOOKS * GENDER 

Level 7 vs. Level 3 


781.250 

1 

781.250 

43.259 

0.000 

(Aparencia * Genero) 

(Nivel 1 vs. Nivel 3) 







Level 2 vs. Level 3 
(Nivel 1 vs. Nivel 3) 

540.800 

1 

540.800 

30.225 

0.000 

Error(LOOKS) 

Level 1 vs. Level 3 


325.078 

18 

18.060 



(Erro(Aparencia) 

(Nivel 1 vs. Nivel 3) 







Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 

322.067 

18 

17.893 



CHARISMA 


Level 7 vs. Level 3 

3276.800 

1 

3276.800 

109.937 

0.000 

(Carisma) 


(Nivel 1 vs. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 2 i/s. Nivel 3) 

4500.000 

1 

4500.000 

227.941 

0.000 

CARISMA * GENDER 


Level 7 vs. Level 3 

810.689 

1 

810.689 

27.199 

0.000 

(Carisma * Genero) 


(Nivel 1 vs. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 

665.089 

1 

665.089 

33.689 

0.000 

Error(CHARISMA) 


Level 7 vs. Level 3 

536.511 

18 

29.806 



(Erro(CARISMA) 


(Nivel 1 i/s. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 

355.356 

18 

19.742 



LOOKS * CARISMA 

Level 1 vs. Level 3 

Level 1 vs. Level 3 

3976.200 

1 

3976.200 

21.944 

0.000 

(Aparencia * Carisma) 

(Nivel 1 vs. Nivel 3) 

(Nivel 1 vs. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 1 i/s. Nivel 3) 

441.800 

1 

441.800 

4.091 

0.058 


Level 2 vs. Level 3 

Level 7 vs. Level 3 

911.250 

1 

911.250 

6.231 

0.022 


(Nivel 2 vs. Nivel 3) 

(Nivel 1 vs. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 

7334.450 

1 

7334.450 

88.598 

0.000 

LOOKS * CHARISMA 

Level 1 vs. Level 3 

Level 7 vs. Level 3 

168.200 

1 

168.200 

0.928 

0.348 

* GENDER (Apa- 

(Nivel 1 vs. Nivel 3) 

(Nivel 1 i/s. Nivel 3) 






rencia * Carisma * 


Level 2 vs. Level 3 

6552.200 

1 

6552.200 

60.669 

0.000 

Genero) 


(Nivel 2 vs. Nivel 3) 







Level 2 vs. Level 3 

Level 1 vs. Level 3 

1711.250 

1 

1711.250 

11.701 

0.003 


(Nivel 2 vs. Nivel 3) 

(Nivel 1 vs. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 2 i/s. Nivel 3) 

110.450 

1 

110.450 

1.3334 

0.263 

ErrorfLOOKS * CARIS- 

Level 7 vs. Level 3 

Level 1 vs. Level 3 

3261.600 

18 

181.200 



MA) (Erro( Apa rencia 

(Nivel 1 vs. Nivel 3) 

(Nivel 1 vs. Nivel 3) 






* Carisma)) 


Level 2 vs. Level 3 
(Nivel 2 i/s. Nivel 3) 

1944.000 

18 

108.000 




Level 2 vs. Level 3 

Level 7 vs. Level 3 

2632.500 

18 

146.250 




(Nivel 2 vs. Nivel 3) 

(Nivel 1 vs. Nivel 3) 
Level 2 vs. Level 3 
(Nivel 2 vs. Nivel 3) 

1490.100 

18 

82.783 
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para a linha LOOKS (Aparencia). Lembre que 
fizemos um contraste simples, assim, temos 
um contraste comparando o rnvel 1 com o 
rnvel 3 e, entao, comparando o rnvel 2 com 
o rn'vel 3. Por causa da ordem em que entra- 
mos as variaveis, esses contrastes representam 
atraente comparado com mediano (rn'vel 1 vs. 
rnvel 3) e feio comparado com mediano (rnvel 
2 vs. rnvel 3). Observando os valores de F para 
cada contraste e seus valores de significance 
relacionados, isso nos informa que o efeito da 
atratividade representa o fato de que acom- 
panhantes atraentes foram avaliados signifi- 
cativamente mais alto do que acompanhantes 
medianos, F (1, 18) = 226,99, p < 0,001, e 
os acompanhantes medianos foram avaliados 
significativamente mais alto do que os feios, F 
(1, 18)= 160,07, p< 0,001. 

12.4.3 0 efeito do carisma © 

O efeito principal do carisma esta na 
Saida 12.3 do SPSS. Podemos relatar que 
houve um efeito principal significativo do ca¬ 
risma, F (2, 36) = 328,25, p < 0,001. Esse 
efeito nos diz que se ignorarmos todas as ou- 
tras variaveis, as avaliacdes diferem em muito 
carismaticos, pouco carismaticos e chatos. A 
tabela CHARISMA (Carisma) na segao cha- 
mada de Estimated Marginal Means (Me- 
dias Marginais Estimadas) nos informa o que 
esse efeito significa (Saida 12.8 do SPSS). 
Novamente, os mveis do carisma estao classi- 
ficados como 1, 2 e 3. Se voce seguiu o que eu 


Saida 12.8 do SPSS 

3 CHARISMA (Carisma) 

Measure: MEASUREJ (Medida: MEDIDA1) 


CHARISMA 

(Carisma) 

Mean 

(Media) 

Std. 

Error 

(Erro 

Padrao) 

95% Confidence 
Interval (Intervalo de 
95% de confianga) 

Lower 

Bound 

(Limite 

Inferior) 

Upper 

Bound 

(Limite 

Superior) 

i 

82.100 

1.010 

79.978 

84.222 

2 

54.300 

0.573 

53.096 

55.504 

3 

69.300 

0.732 

67.763 

70.837 


fiz, o rnvel 1 e muito carisma, o rnvel 2 e sem 
carisma e rnvel 3 e algum carisma. Essa infor- 
macao esta tragada na Figura 12.8: a medida 
que o carisma declina, a media das avaliacdes 
tambem diminui. Assim, esse efeito princi¬ 
pal parece refletir que os avaliadores tinham 
maior probabilidade de expressar um interes- 
se maior em sair com pessoas carismaticas do 
que com pessoas medianas ou chatas. 

A Saida 12.7 do SPSS mostra os con¬ 
trastes que solicitamos. Observando a tabela 
na linha CHARISMA (Carisma) e lembrando 
nos solicitamos contrastes simples, consegui- 
mos um contraste comparando o rnvel 1 com 
o rnvel 3 e, entao, comparando o rnvel 2 com 
o rnvel 3. Como interpretamos esses contrastes 
depende da ordem que entramos com as varia¬ 
veis de medidas repetidas: nesse caso, esses 
contrastes representam muito carisma compa¬ 
rado com pouco carisma (rn'vel 1 vs. rnvel 3) 
e chato comparado com pouco carisma (rnvel 
2 vi. rnvel 3). Os contrastes nos dizem que o 
efeito do carisma representou o fato de que 
acompanhantes com muito carisma foram ava¬ 
liados significativamente mais alto do que com 
pouco carisma, F ( 1,18) = 109,94,/? < 0,001 e 
acompanhantes medianos foram avaliados sig¬ 
nificativamente mais alto do que os feios, F (1, 
18) = 227,94,/? <0,001. 

12.4.4 A interagao entre genero e 
aparencia © 

A Saida 12.3 do SPSS indica que o genera 
interagiu de alguma maneira com a atratividade 
do acompanhante. Da tabela resumo devemos 
relatar que houve uma intera^ao significativa en- 
tre a atratividade do acompanhante e o genera do 
participante, F( 2, 36) = 80,43, p < 0,001. Esse 
efeito nos diz que o perfil das avalia 9 oes entre 
os acompanhantes de atratividade diferente foi 
distinto para homens e mulheres. Podemos usar 
as medias marginais estimadas para determinar a 
natureza dessa intera 9 ao (ou poderfamos ter so- 
licitado ao SPSS um grafico de gender x looks 
usando uma caixa de dialogo semelhante a da 
Figura 12.5). As medias e o grafico de intera 9 ao 
(Saida 12.9 do SPSS e Figura 12.9) mostram o 
significado desse resultado. O grafico mostra a 
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Carisma 

Figura 12.8 Diagrama de Barras de Erro para o Carisma mostrando um 1C de 95% para a media. 


Saida 12.9 do SPSS 


4. Gender * LOOKS (Genero * Aparencia) 


Measure: MEASURE J (Medida: MEDIDA1) 


LOOKS 

GENDER (Genero) (Aparencia) 

Mean 

(Media) 

Std. Error 
(Erro Padrao) 

95% Confidence Interval 
(Intervalo de 95% de confianga) 

Lower Bound 
(Limite Inferior) 

Upper Bound 
(Limite Superior) 

Male (Masculino) 1 

88.033 

0.923 

86.095 

89.972 

2 

50.300 

0.921 

48.366 

52.234 

3 

67.467 

1.159 

65.031 

69.902 

Female (Feminino) 1 

76.167 

0.923 

74.228 

78.105 

2 

61.333 

0.921 

59.399 

63.267 

3 

68.100 

1.159 

65.665 

70.535 


media das avalia 9 oes dos acompanhantes dos 
homens de diferentes atratividades ignorando 
quao atrativo o acompanhante era (cfrculos). 
Os escores das mulheres sao mostrados como 
quadrados. 0 grafico, claramente, mostra que 
as avaliagoes de homens e mulheres sao muito 
semelhantes para acompanhantes com aparencia 
mediana, mas os homens dao avaliagoes mais al- 


tas (isto e, eles preferem sair com essas pessoas) 
que as mulheres para acompanhantes atraentes, 
enquanto as mulheres expressam maior interesse 
em sair com pessoas feias do que homens. Em 
geral, essa intera 9 ao parece sugerir que o in¬ 
teresse dos homens em sair com uma pessoa e 
mais influenciado por sua aparencia do que para 
as mulheres. Embora o interesse de homens e 
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Figura 12.9 



mulheres diminua a medida que a atratividade 
diminui, esse decrescimo e mais pronunciado 
nos homens. Essa interagao pode ser esclareci- 
da usando os contrastes especificados antes da 
analise. 

12.4.4.1 Interagao 1 aparencia x genero: 
atrativo x mediano, homem x 
mulher © 

O primeiro termo de interagao analisa o 
nfvel 1 da aparencia (atraente) comparado ao 
nfvel 3 (mediano), comparando os escores de 
homens e mulheres. O contraste e altamente 
significativo, F(\. 18) = 43,26 ,p < 0,001. Esse 
resultado nos mostra que o aumento de interes- 
se em acompanhantes atraentes comparado aos 
acompanhantes de aparencia mediana nos ho¬ 
mens e mais significativo do que nas mulheres. 
Assim, na Figura 12.9 a inclinagao da linha en- 
tre os cfrculos representando as avaliagoes mas- 
culinas de acompanhantes atraentes e acom¬ 
panhantes medianos e mais fngreme do que a 
linha ligando os quadrados representando as 
avaliagoes das mulheres para os acompanhan¬ 
tes atraentes e medianos. Podemos concluir 
que a preferencia por acompanhantes atraentes 
comparado aos de aparencia mediana e maior 
para os homens do que para as mulheres. 


12.4.4.2 Interagao 2 aparencia x genero: 
feio x mediano, homem x 
mulher © 

O segundo termo de interagao compara o 
nfvel 2 de aparencia (feio) com o nfvel 3 (me¬ 
diano), comparando os escores de homens e 
mulheres. Esse contraste e altamente significa¬ 
tivo, F(l, 18) = 30,23, p < 0,001. Isso nos diz 
que o decrescimo do interesse em acompanhan¬ 
tes feios comparado aos acompanhantes media¬ 
nos para homens e significativamente maior do 
que para as mulheres. Assim, na Figura 12.9 a 
inclinagao da linha entre os cfrculos represen¬ 
tando as avaliagoes dos homens para acompa¬ 
nhantes feios e medianos e mais fngreme do que 
a linha unindo os quadrados representando as 
avaliagoes femininas para acompanhantes feios 
e medianos. Podemos concluir que a preferen¬ 
cia para acompanhantes de aparencia mediana, 
comparado com acompanhantes feios, e maior 
para os homens do que para as mulheres. 

12.4.5 A interagao entre genero e 
carisma © 

A Safda 12.3 do SPSS indicou que o gene¬ 
ro interagia de alguma maneira com o quanto 
carismatico o acompanhante era. A partir da 
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tabela resume* podemos relatar que havia uma 
interagao significativa entre a atratividade do 
acompanhante e o genero do participante, F( 2, 
36) = 62,45, p < 0,001. Esse efeito nos diz que 
o perfil das avaliagoes atraves dos acompanhan- 
tes dos diferentes nfveis do carisma foi diferen- 
te para homens e mulheres. A media marginal 
estimada (ou um grafico do genero x carisma 
usando a caixa de dialogo semelhante a da Fi- 
gura 12.5) nos revela o significado dessa inte¬ 
ragao (veja a Saida 12.10 do SPSS e a figura 
12.10 que mostra o significado desse resulta- 
do). O grafico mostra a media das avaliagoes 
dos acompanhantes feitas pelos homens nos 
diferentes niveis do carisma ignorando quao 
atraentes eles eram (circulos). Os escores das 
mulheres sao apresentados como quadrados. 
O grafico mostra um padrao quase contrario 
para os dados de atratividade; novamente, as 
avaliagoes dos homens e mulheres sao muito 
similares com uma quantidade normal de caris¬ 
ma, mas dessa vez, os homens mostram mais 
interesse em acompanhantes entediantes do que 
as mulheres e as mulheres mostram um interes¬ 
se um pouco maior em acompanhantes muito 
carismaticos do que os homens. Em geral, essa 
interagao parece sugerir que o interesse das mu¬ 
lheres em sair com uma pessoa e mais influen- 
ciado pelo seu carisma do que os homens. Em- 
bora tanto o interesse dos homens e mulheres 
diminua a medida que o carisma diminui, esse 
decrescimo e mais pronunciado nas mulheres. 
Essa interacao pode ser esclarecida usando os 
contrastes especificados antes da analise. 


12.4.5.1 Interagao 1 carisma x genero: 
muito x pouco carisma, homem 
x mulher © 

O primeiro termo de interagao analisa o 
nfvel 1 do carisma (muito carisma) em relagao 
ao nivel 3 (pouco carisma), comparando os es¬ 
cores dos homens e mulheres. Esse contraste e 
altamente significativo, F (1, 18) = 27,20, p < 
0,001. Esse resultado nos diz que o aumento do 
interesse em acompanhantes com muito caris¬ 
ma comparado com acompanhantes com pouco 
carisma encontrado em mulheres e significati- 
vamente maior do que para os homens. Assim, 
na Figura 12.10 a inclinacao da linha entre os 
quadrados representando as avaliagoes femi- 
ninas de acompanhantes muito carismaticos e 
com pouco carisma e mais fngreme do que a li¬ 
nha ligando os circulos representando as avalia¬ 
goes dos homens para os acompanhantes com 
muito carisma e com pouco carisma. Podemos 
concluir que a preferencia para os acompanhan¬ 
tes carismaticos, comparados com os acompa¬ 
nhantes pouco carismaticos, e maior para as 
mulheres do que para os homens. 

12.4.5.2 Interagao 2 carisma x genero: 
chato x pouco carisma, homem 
x mulher © 

O segundo termo de interagao analisa o 
nfvel 2 de carisma (chato) em relagao ao nfvel 
3 (pouco carisma), comparando os escores de 
homens e mulheres. Esse contraste e altamen- 


Saida 12.10 do SPSS 


5. Gender * CHARISMA (Genero * Carisma) 

Measure: MEASUREJ (Medida: MEDIDA1) 


CHARISMA 

GENDER (Genero) (Carisma) 

Mean 

(Media) 

Std. Error 
(Erro Padrao) 

95% Confidence Interval 
(Intervalo de 95% de confianga) 

Lower Bound 
(Limite Inferior) 

Upper Bound 
(Limite Superior) 

Male (Masculino) 1 

75.967 

1.428 

72.966 

78.967 

2 

60.300 

0.810 

58.598 

62.002 

3 

69.533 

1.035 

67.360 

71.707 

Female (Feminino) 1 

88.233 

1.428 

85.233 

91.234 

2 

48.300 

0.810 

46.598 

50.002 

3 

69.067 

1.035 

66.893 

71.240 
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Muito Pouco Chato 

Carisma Carisma 


Carisma 

Figura 12.10 Diagrama de Interagao entre Genero e Carisma. 


te significative), F( 1, 18) = 33,69, p < 0,001. 
Esse resultado nos diz que o decrescimo do 
interesse em acompanhantes chatos compa- 
rado aos com carisma mediano para as mu- 
lheres e significativamente maior do que para 
homens. Assim, na Figura 12.10, a inclinagao 
da linha entre os quadrados representando as 
avaliacoes dos acompanhantes femininos com 
pouco carisma ou acompanhantes chatos e 
mais ingreme do que a linha unindo os circu- 
los representando as avaliagSes dos homens 
para seus acompanhantes com pouco carisma 
e acompanhantes chatos. Podemos concluir 
que a preferencia para acompanhantes com 
pouco carisma sobre os chatos foi maior nas 
mulheres do que nos homens. 

12.4.6 A interacao entre atratividade e 
carisma © 

A Saida 12.3 do SPSS indicou que a atra¬ 
tividade do acompanhante interagia de algu- 
ma maneira com quao carismatico ele era. 
Da tabela resumo devemos relatar que havia 
uma interacao significativa entre a atrativida¬ 
de do acompanhante e o seu carisma, F (4,72) 


= 36,63, p < 0,001. Esse efeito nos informa 
que o perfil das avaliacoes ao longo dos acom¬ 
panhantes nos diversos niveis de carisma foi 
diferente para acompanhantes atraentes, me- 
dianos e feios. As medias marginais estima- 
das (ou um grafico da aparencia x carisma 
usando a caixa de dialogo da Figura 12.5) nos 
informam o significado dessa interacao (veja 
a Saida 12.11 do SPSS e a Figura 12.11, que 
mostram o significado desse resultado). 

O grafico mostra a media das avaliacoes 
dos acompanhantes de diferentes niveis de 
atratividade quando o acompanhante tambem 
tinha muito carisma (circulos), pouco carisma 
(quadrados) e era chato (triangulos). Olhe pri- 
meiro para as diferen^as entre acompanhantes 
atraentes e medianos. O interesse em acompa¬ 
nhantes muito carismaticos nao muda (a linha 
e mais ou menos reta entre esses dois pontos), 
mas para acompanhantes com pouco carisma 
ou chatos os niveis de interesse declinam. As¬ 
sim, se voce tern muito carisma, mas uma apa¬ 
rencia mediana, as pessoas ainda vao querer 
sair com voce. Agora, se voce olhar para a di- 
ferenga entre os acompanhantes de aparencia 
mediana e os feios, um padrao diferente e ob- 
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Saida 12.11 do SPSS 

6. LOOKS * CHARISMA (Aparencia * Carisma) 


Measure: MEASURE_1 (Medida: MEDIDA1) 


LOOKS CHARISMA 

(Aparencia) (Carisma) 

Mean 

(Media) 

Std. Error 
(Erro Padrao) 

95% Confidence Interval 
(Intervalo de 95% de confianga) 

Lower Bound 
(Limite Inferior) 

Upper Bound 
(Limite Superior) 

i i 

89.950 

1.383 

86.045 

91.855 

2 

69.550 

1.019 

67.409 

71.691 

3 

87.800 

1.408 

84.842 

90.758 

2 1 

71.750 

1.249 

69.126 

74.374 

2 

45.950 

0.746 

44.382 

47.518 

3 

49.750 

1.211 

47.206 

52.294 

3 1 

85.600 

1.721 

81.985 

89.215 

2 

47.400 

0.888 

45.535 

49.265 

3 

70.350 

1.172 

67.888 

72.812 



servado. Para os acompanhantes chatos (trian- 
gulos), nao existe diferenca entre pessoas feias 
e medianas (assim, se voce for chato, preci- 
sa ser muito atraente para alguem convida-lo 
para sair). Entretanto, para aqueles com caris¬ 
ma, existe um declfnio no interesse se for feio 
(ou seja, se voce for feio, ter carisma nao ira 
ajuda-lo muito). Essa interagao e muito com- 
plexa, mas podemos analisa-la usando os con- 
trastes especificados antes da analise. 


12.4.6.1 Interagao 1 aparencia x carisma: 
atraente x mediano, muito 
carisma x pouco carisma © 

O primeiro termo de interagao investiga o 
nfvel 1 da aparencia (atraente) em relagao ao nf- 
vel 3 (aparencia mediana), comparando o nfvel 
1 do carisma (muito carisma) ao nfvel 3 do ca¬ 
risma (pouco carisma). E como se perguntasse- 
mos: “a diferenga entre muito carisma e pouco 
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carisma e a mesma para pessoas atraentes e pes- 
soas de aparencia mediana?”. A melhor maneira 
de entender o que esse contraste esta testando e 
extrair a parte relevante do grafico de interagao 
na Figura 12.11. Se voce observar isso, pode 
ver que o interesse (como indicado pelas altas 
avaliagoes) por acompanhantes atraentes foi o 
mesmo apesar de eles terem muito ou pouco 
carisma. Entretanto, para acompanhantes de 
aparencia mediana, havia um interesse maior 
quando a pessoa tinha muito carisma em vez de 
pouco. O contraste e altamente significativo, F 
(1. 18) = 21,94, p < 0,001 e nos informa que 


a medida que os acompanhantes se tomam me- 
nos atraentes, ha um declfnio maior no interes¬ 
se quando o carisma e pouco comparado com 
quando o carisma e muito. 

12.4.6.2 Interagao 2 aparencia x carisma: 
atraente x mediano, chato x 
pouco carisma © 

O segundo termo de interagao investiga 
o nfvel 1 da aparencia (atraente) em rela- 
qao ao mvel 3 (aparencia mediana), quando 
comparado ao nfvel 2 do carisma (chato) ao 



Atratividade 





















Descobrindo a Estatistica Usaimdo o SPSS 461 


nfvel 3 do carisma (pouco carisma). E como 
se perguntassemos: “a diferenga entre cha- 
to e pouco carisma e a mesma para pessoas 
atraentes e pessoas de aparencia mediana?”. 
Novamente, a melhor maneira de entender o 
que o contraste esta testando e extrair a parte 
relevante do grafico de interagao da Figura 
12.11. Se voce observar isso, pode ver que o 
interesse (como indicado pelas altas avalia- 
cbes) em acompanhantes atraentes foi mais 
alto quando eles tinham pouco carisma do 
que quando eles eram chatos. O mesmo vale 
para acompanhantes de aparencia mediana. 
Na verdade, as duas linhas sao paralelas. O 
contraste nao e significativo, h'( 1. 18) = 4,09, 
ns e nos informa que a medida que os acom¬ 
panhantes se tornam menos atraentes, existe 
um declinio no interesse quando o carisma e 
pouco ou quando nao existe carisma. 

12.4.6.3 Interagao 3 aparencia x carisma: 
feio x mediano, muito carisma x 
pouco carisma © 

O terceiro termo de interagao investiga o 
nfvel 2 da aparencia (feio) em relagao ao nfvel 
3 (aparencia mediana), comparando o nfvel 
1 do carisma (muito carisma) ao nfvel 3 do 
carisma (pouco carisma). E como se pergun¬ 
tassemos: “a diferenga entre muito carisma e 
pouco carisma e a mesma para pessoas feias e 


de aparencia mediana?”. Se, novamente, ex- 
trairmos a parte relevante do grafico de inte¬ 
ragao na Figura 12.11, podemos ver que o in¬ 
teresse (como indicado pelas altas avaliagdes) 
diminui dos acompanhantes de aparencia me¬ 
diana para os feios tanto para os acompanhan¬ 
tes com muito carisma quanto nos de pouco 
carisma; entretanto, essa queda e levemente 
maior em acompanhantes com pouco carisma 
(a linha conectando os quadrados e levemente 
mais inclinada). O contraste e significativo, 
F(l,18) = 6,23, p < 0,05 e nos informa que a 
medida que os acompanhantes se tornam me¬ 
nos atraentes, existe um grande declinio no in¬ 
teresse quando o carisma e pouco comparado 
com quando o carisma e muito. 

12.4.6.4 Interagao 4 aparencia x carisma: 
feio x mediano, chato x pouco 
carisma © 

O ultimo termo de interagao analisa o nf¬ 
vel 2 da aparencia (feio) em relagao ao nfvel 3 
(aparencia mediana), quando comparando ao 
nfvel 2 do carisma (chato) ao nfvel 3 do caris¬ 
ma (pouco carisma). E o mesmo que pergun- 
tar: “a diferenga entre chato e pouco carisma 
e a mesma para pessoas feias e pessoas com 
aparencia mediana?”. Se extrairmos a parte 
relevante do grafico de interagao na Figura 
12.11, podemos ver que o interesse (como 
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indicado pelas altas avaliagoes) em acompa- 
nhantes de aparencia mediana foi maior quan- 
do eles tinham pouco carisma do que quando 
eles eram chatos, mas para acompanhantes 
feios as avaliagoes foram aproximadamente as 
mesmas do nfvel do carisma. Esse contraste 
e altamente significativo, F( 1, 18) = 88.60, p 
< 0,001 e nos informa que a medida que os 
acompanhantes se tornam menos atraentes, o 
declinio do interesse em acompanhantes com 
um pouco de carisma e significativamente 
maior do que para os chatos. 


12.4.7 A interagao entre aparencia, 
carisma e genero ® 

A interacao de tres fatores 
nos informa se a interacao 
aparencia x carisma, des- 
crita acima, e a mesma tan- 
to para os homens quanto 
para as mulheres (isto e, se 
o efeito combinado da atra¬ 
tividade do acompanhante e 
do seu nfvel de carisma e o 
mesmo tanto para os parti- 
quanto para mulheres). A 
Safda 12.3 do SPSS nos informa que existe 
uma interacao de tres fatores significativa da 
aparencia x carisma x genero, F( 4, 72) = 
24,12, p < 0,001. A natureza dessa interacao 


esta revelada na Figura 12.12, que mostra a in- 
teragao da aparencia x carisma para homens e 
mulheres separadamente (as medias em que o 
grafico e baseado aparecem na Safda 12.12 do 
SPSS). O grafico dos homens mostra que quan¬ 
do os acompanhantes sao atraentes, os homens 
expressarao alto interesse apesar dos nfveis de 
carisma (cfrculo, quadrado e triangulo se so- 
brepoem). No lado oposto da escala de atrativi¬ 
dade, quando o acompanhante e feio, apesar do 
carisma, os homens expressarao pouco interes¬ 
se (as avaliagoes sao bem baixas). O unico mo¬ 
menta em que o carisma faz diferenga para um 
homem e se a acompanhante tern uma aparen¬ 
cia mediana; nesse caso, ter muito carisma au- 
menta o interesse, ser chata reduz o interesse e 
ter pouco carisma nao prejudica nem melhora. 
A conclusao e que os homens sao uns cretinos 
superficial mais interessados em atributos ffsi- 
cos. O quadro para as mulheres e bem diferen- 
te. Se o acompanhante tem muito de carisma, 
nao importa a sua aparencia, as mulheres irao 
expressar interesse neles (a linha dos cfrculos e 
relativamente reta). No outro extremo, se o 
acompanhante for chato, elas nao irao demons- 
trar interesse apesar da sua atratividade (a linha 
dos triangulos e relativamente reta). A unica 
ocasiao em que a atratividade faz uma diferen- 
ga e quando o acompanhante tem pouco caris¬ 
ma; nesse caso, ser atraente aumenta o interes¬ 
se e ser feio o reduz. Ou seja, as mulheres 



cipantes homens 
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Saida 12.12 do SPSS 

7. Gender * LOOKS * CHARISMA (Genero* Aparencia* Carisma) 


Measure: MEASURE1 (Medida: MEDIDA1) 


LOOKS CHARISMA 

Gender (Genero) (Aparencia) (Carisma) 

Mean 

(Media) 

Std. Error 
(Erro 
Padrao) 

95% Confidence Interval 
(Intervalo de 95% de confianga) 

Lower Bound 
(Limite Inferior) 

Upper Bound 
(Limite Superior) 

Male (Masculino) 1 1 

88.300 

1.956 

84.191 

92.409 

2 

87.300 

1.441 

84.273 

90.327 

3 

88.500 

1.991 

84.317 

92.683 

2 1 

56.800 

1.767 

53.089 

60.511 

2 

45.800 

1.055 

43.583 

48.017 

3 

48.300 

1.712 

44.703 

51.897 

3 1 

82.800 

2.434 

77.687 

87.913 

2 

47.800 

1.255 

45.163 

50.437 

3 

71.800 

1.657 

68.318 

75.282 

Male (Feminino) 1 1 

89.600 

1.956 

85.491 

93.709 

2 

51.800 

1.441 

48.773 

54.827 

3 

87.100 

1.991 

82.917 

91.283 

2 1 

86.700 

1.767 

82.989 

90.411 

2 

46.100 

1.055 

43.883 

48.317 

3 

51.200 

1.712 

47.603 

54.797 

3 1 

88.400 

2.434 

83.287 

93.513 

2 

47.000 

1.255 

44.363 

49.637 

3 

68.900 

1.657 

65.418 

72.382 


Masculino Feminino 



Figura 12.12 Graficos mostrando a interagao aparencia x carisma para homens e mulheres. As 
linhas representam alto carisma (circulos), pouco carisma (quadrados) e chato (triangulos). 
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Masculino Feminino 



priorizam o carisma a aparencia fisica. Nova- 
mente, podemos analisar alguns contrastes para 
entender essa interagao. Esses contrastes sao 
semelhantes aqueles da interagao aparencia x 
carisma, mas agora eles tambem levam ern 
conta o genero! 

12.4.7.1 Interagao 1 aparencia x carisma x 
genero: atraente x mediano, muito 
carisma x pouco carisma, homem 
x mulher® 

O primeiro termo de interagao relaciona o 
nivel 1 da aparencia (atraente) ao nivel 3 (apa¬ 
rencia mediana), quando o nivel 1 do carisma 
(muito carisma) e comparado ao nivel 3 do caris¬ 
ma (pouco carisma) em homens comparados as 
mulheres, F (1,18) < 1, ns. Se extrairmos as par¬ 
tes relevantes do grafico de interagao na Figura 
12.12, podemos ver que o interesse (como indi- 
cado pelas altas avaliagoes) em acompanhantes 
atraentes foi o mesmo apesar de muito ou pou¬ 
co carisma. Entretanto, para acompanhantes de 
aparencia mediana, havia maior interesse quan¬ 
do a pessoa tinha mais carisma do que pouco. 
Mais importante, esse padrao de resultados e o 
mesmo em homens e mulheres e isso esta refle- 
tido na nao-significancia desse contraste. 


12.4.7.2 Interagao 2 aparencia x carisma 
x genero: atraente x mediano, 
chato x pouco carisma, homem 
x mulher © 

O segundo termo de interagao compara o 
nivel 1 da aparencia (atraente) ao nivel 3 (apa¬ 
rencia mediana) quando o nivel 2 do carisma 
(chato) e relacionado ao nivel 3 do carisma 
(pouco carisma), em homens comparados as 
mulheres. Novamente, extraimos a parte rele- 
vante do grafico de interagao da Figura 12.12 
e voce pode ver que os padroes sao diferentes 
para homens e mulheres. Isso e refletido pelo 
fato de que o contraste e significativo, F( 1, 
18) = 60,67, p < 0,001. Para entender isso, 
precisamos olhar o grafico. Primeiro, se ana- 
lisarmos os acompanhantes de aparencia me¬ 
diana, tanto para os homens quanto para as 
mulheres o maior interesse e expresso quando 
os acompanhantes tern pouco carisma do que 
quando sao chatos (e a distancia entre o qua- 
drado e o triangulo e quase a mesma). Assim, 
a diferenga nao parece estar aqui. Se agora 
olharmos os acompanhantes atraentes, vemos 
que os homens estao igualmente interessados 
em seus acompanhantes independentemente 
do seu carisma, mas para as mulheres, elas 
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Masculino Feminino 



sao menos atrafdas por uma pessoa atraente 
se ela for chata. Ou seja, para acompanhan- 
tes atraentes, a distancia entre o quadrado e o 
triangulo e muito menor para homens do que 
para mulheres. Outra maneira de analisar isso 
e que para acompanhantes com pouco caris- 
ma, a reducao no interesse quando a atrativi- 
dade diminui e quase a mesma em homens 
e mulheres (as linhas com os quadrados tem 
a mesma inclinacao). Entretanto, para acom¬ 
panhantes chatos, o decrescimo no interesse 
se esses acompanhantes sao de aparencia me- 
diana em vez de atraentes, e muito maior em 
homens do que em mulheres (a linha com tri- 
angulos e mais inclinada para homens do que 
para as mulheres). Isso e o que o contraste 
significativo nos informa. 

12.4.7.3 Interagao 3 aparencia x carisma 
x genera: feio x mediano, muito 
carisma x pouco carisma, homem 
x mulher ® 

O terceiro termo de interagao compara 
o nivel 2 da aparencia (feio) com o nfvel 3 
(aparencia mediana), quando o nivel 1 do ca¬ 


risma (muito carisma) e relacionado ao nivel 
3 do carisma (pouco carisma), em homens 
em comparagao as mulheres. Novamente, 
extraimos a parte relevante do grafico de 
interagao da Figura 12.12 e voce pode ver 
que os padroes sao diferentes para homens e 
mulheres. Isso e refletido pelo fato de que o 
contraste e significativo, F(l, 18) = 11,70, p 
< 0,01. Para entender isso, precisamos olhar 
o grafico. Primeiro, vamos analisar os ho¬ 
mens. Para os homens, a medida que a atrati- 
vidade diminui, o interesse tambem diminui 
quando a acompanhante tem muito ou pouco 
carisma. De fato, as linhas sao paralelas. As- 
sim, apesar do carisma, existe uma redugao 
similar no interesse a medida que a atrativi- 
dade diminui. Para as mulheres, o quadro e 
bem diferente: quando tem muito carisma, 
nao ha declmio no interesse a medida que a 
atratividade diminui (a linha conectando os 
circulos e reta), mas quando tem pouco ca¬ 
risma, a atratividade do acompanhante nao 
interessa e o interesse e menor num acom¬ 
panhante feio do que num de aparencia me¬ 
diana. Outra maneira de analisar isso e que 
para acompanhantes com pouco carisma, a 
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reducao no interesse, a medida que a atrati- 
vidade diminui, e quase a mesma em homens 
e mulheres (as linhas com quadrados tem a 
mesma inclinagao). Entretanto, para acom- 
panhantes que tem muito carisma, o decres- 
cimo no interesse se os acompanhantes sao 
feios em vez de aparencia mediana, e muito 
maior em homens do que em mulheres (a li- 
nha com circulos e muito mais inclinada para 
homens do que para mulheres). Isso e o que 
o contraste significativo nos informa. 


12.4.7.4 Interagao 4 aparencia x carisma 
x genero: atraente x mediano, 
chato x pouco carisma, homem x 
mulher® 

O ultimo termo de interagao compara o 
nivel 2 da aparencia (feio) com o nivel 3 (apa¬ 
rencia mediana), quando relacionado o nivel 2 
do carisma (chato) ao nivel 3 do carisma (pou¬ 
co carisma), em homens comparados as mu¬ 
lheres. Se extrairmos as partes relevantes do 
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Atratividade 
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grafico de interagao da Figura 12.12, podemos 
ver que o interesse (como indicado pelas altas 
avaliagoes) em acompanhantes feios foi o mes- 
mo independentemente de eles terem muito ou 
pouco carisma. Entretanto, para acompanhan¬ 
tes de aparencia mediana, havia mais interesse 
quando a pessoa tinha pouco carisma do que se 
ela fosse chata. Mais importante, esse padrao 
de resultados e o mesmo para homens e mu- 
lheres e isso esta refletido na nao-significancia 
desse contraste, F(l, 18) = 1,33, ns. 

12.4.8 Conclusdes ® 

Esses contrastes nada nos informam sobre 
as diferengas entre as condicoes atraente e feio 
ou as condigoes de muito ou pouco carisma 


porque elas nunca foram comparadas. Pode¬ 
mos executar a analise novamente e especifi- 
car nossos contrastes de forma diferente para 
conseguir esses efeitos. Entretanto, o que esta 
claro dos nossos dados e que existem dilerencas 
entre homens e mulheres em termos de como 
eles sao afetados pela aparencia e personalidade 
dos acompanhantes. Os homens parecem que- 
rer sair com qualquer mulher que seja atraente 
independentemente de quao hornvel e sua per¬ 
sonalidade. As mulheres sao quase o oposto: 
querem sair com qualquer homem que tenha 
muito carisma independentemente da sua apa¬ 
rencia (e rejeitam sair com pessoas chatas nao 
importa quao atraentes sejam). A unica seme- 
lhanga entre homens e mulheres e quando exis- 
te algum carisma (mas nao muito): nesse caso, 


f 

Dica da Samanta Ferrinho 





V 


• A ANOVA mista compara varias medias quando existem duas ou mais varia- 
veis independentes e, pelo menos, uma das variaveis foi mensurada usando 
os mesmos participantes e, no minimo, outra variavel foi mensurada usando 
participantes diferentes. 

• Teste as hipoteses da esfericidade para a(s) variave(is) de medidas repetidas 
quando elas tern tres ou mais condigoes usando o teste de Mauchly. Se o valor 
na coluna Sig. e menor do que 0,05, a hipotese foi violada. Se a significancia do 
teste de Mauchly e maior do que 0,05, a hipotese de esfericidade esta mantida. 
Voce deve testar essa hipotese para todos os efeitos (se ha duas ou mais varia¬ 
veis de medidas repetidas, isso significa que voce deve testar a hipotese para 
todas as variaveis e para os termos de interagao correspondentes). 

• A tabela Efeitos entre participantes mostra os resultados para a ANOVA de 
medidas repetidas e todos os efeitos de interagao. Para cada efeito, se a hi¬ 
potese de esfericidade foi satisfeita, olhe para linha Esfericidade Assumida 
[Sphericity Assumed). Se a hipotese foi violada, leia a linha Greenhouse e 
Geiser (voce tambem pode olhar Huynh-Feidt, mas deve ler o capitulo ante¬ 
rior para descobrir os pros e contras dos dois procedimentos). Tendo selecio- 
nado a linha apropriada, olhe para a coluna Sig.: se o valor for menor do que 
0,05, as medias dos grupos sao significativamente diferentes. 

• A tabela "Testes dos Efeitos entre Participantes" (Tests of Between-Subjects 
Effects) mostra os resultados da ANOVA para as variaveis entre grupos. Ob¬ 
serve a tabela Sig.: se o valor for menor do que 0,05, as medias dos grupos 
sao significativamente diferentes. 

• Analise os efeitos principals e os termos de interagao usando contrastes. Es¬ 
ses contrastes aparecem na tabela "Testes dos Contrastes entre Participantes" 
(Tests of Within-Subjects Contrasts); novamente, observe a coluna Sig. para 
descobrir se as suas comparagoes sao significativas (elas serao se o valor de 
significancia for menor do que 0,05). 

• Observe as medias, ou melhor, faga graficos para ajuda-lo a interpretar esses 
contrastes. 
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para ambos os generos a atratividade influencia 
o desejo de sair com essa pessoa. 

Neste capftulo deve ficar claro que quando 
mais de duas variaveis independentes sao usa- 
das numa ANOVA, ela gera efeitos de intera¬ 
gao complexos que exigem muita concentragao 
para interpretar (imagine interpretar uma inte¬ 
ragao de quatro fatores!). Portanto, e essencial 
ter uma abordagem sistematica para a interpre- 
tagao, e tragar graficos e um metodo inteligente. 
Tambem e aconselhavel pensar cuidadosamen- 
te sobre os contrastes apropriados para usar na 
resposta das questoes que voce tern sobre seus 
dados. Sao esses contrastes que irao ajuda-lo a 
interpretar as interagoes, portanto, verifique se 
voce selecionou os mais adequados! 

12.5 CALCULANDO 0 TAMANHO DE 
EFEITO @ 


Para as duas comparagoes que fizemos 
para a variavel aparencia (Saida 12.7 do SPSS), 
obtemos: 


r = , 226 >" -Q96 

m“' \ 226,99 + 18 ’ 


'Feio vs. Mediano 


160,07 
160,07 + 18 


0,95 


Portanto, ambas as comparagoes geram 
tamanhos massivos do efeito. Para as duas 
comparagoes que fizemos para a variavel do 
carisma (Saida 12.7 do SPSS), temos: 


'Muito vs. Pouco 


'Chato vs. Pouco 


109.94 

109.94 + 18 

227.94 

227.94 + 18 


0,93 


0,96 



Os tamanhos dos efeitos 
sao mais uteis quando resu- 
mem um efeito focado. Isso 
me da boa desculpa para burlar 
as complexidades do omega 
quadrado em delineamentos mistos (e o cami- 
nho para a loucura, eu asseguro). Portanto, 
apenas calcule o tamanho dos efeitos para os 
seus contrastes quando voce tern um delinea- 
mento fatorial (e qualquer outro efeito que 
compare somente dois grupos). A Saida 12.7 
do SPSS mostra os valores para muitos con¬ 
trastes, todos tendo 1 grau de liberdade para o 
modelo (isto e, eles representam uma compa- 
ragao interpretavel e focada) e 18 graus de li¬ 
berdade residuais. Podemos usar as razoes Fe 
converte-las em um tamanho de efeito r usan- 
do uma formula que ja vimos anteriormente: 


F(l,gl R )+gl R 


Primeiro, podemos lidar com o efeito 
principal do genero porque ele compara so¬ 
mente dois grupos: 


Novamente, ambas as comparagoes geram 
massivos tamanhos do efeito. Para a interagao 
aparencia x genero, temos, novamente, dois 
contrastes: 



43,26 

= 0,84 

^Atraente vs. Mediano, ^ 

Homens vs. Mulheres 

V 43,26 + 18 


1 30,23 

= 0,79 

^Feio vs. Mediano, ^ 

Homens vs. Mulheres 

V 30,23 + 18 


Novamente, esses sao efeitos massivos. 
Para a interagao carisma x genero, os dois 
contrastes nos dao: 


Y 

Muito vs. Pouco, 
Homens vs. Mulheres 


27,20 
27,20 + 18 


= 0,78 


Y 

Chato vs. Pouco, 
Homens vs. Mulheres 


33,69 
33,69 + 18 


= 0,81 


Mais uma vez efeitos massivos (nem da 
para notar que os dados sao inventados!). Na 
interagao aparencia x carisma, temos quatro 
contrastes: 




0,005 
0,005 + 18 


0,02 


Y 

Atraente vs. Mediano, 
Muito vs. Pouco 


21,94 
21,94 + 18 


= 0,74 
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^Atraente vs. Mediano, 
Chato vs. Pouco 


4,09 

4,09 + 18 


0,43 


feio vs. Mediano, 
Muito vs. Pouco 


6,23 

6,23 + 18 


= 0,51 


+lto vs. Mediano, 
Chato vi'. Pouco 


88,60 
88,60 + 18 


= 0,91 


Todos esses efeitos estao num intervalo 
de medio para massivo. Finalmente, para a in- 
teragao aparencia x carisma x genera, temos 
quatro contrastes: 


y 

Atraente v.9. Mediano, _ 
Muito vs. Pouco, 

Homens vs. Mulheres 


0,93 

0,93 + 18 


= 0,22 


Y 

Atraente vs. Mediano, _ 
Chato vs. Pouco, 

Homens vs. Mulheres 


60,67 
60,67 + 18 


= 0,88 


Y 

Feio vs. Mediano, 
Muito vs. Pouco, 
Homens vs. Mulheres 


11,70 
11,70 + 18 


= 0,63 


Y 

Feio vs. Mediano, 
Chato vs. Pouco, 
Homens vs. Mulheres 


1,33 

1,33 + 18 


= 0,26 



Desse modo, os dois efei¬ 
tos que sao significativos 
(atraente vs. mediano, chato 
vs. algum, homens vs. mulhe¬ 
res, e feio vs. mediano, alto vs. 
algum, homens vs. mulheres) geram tamanhos 
dos efeitos grandes. Os dois efeitos que nao 
sao significativos geram tamanhos de efeito 
proximos a medio. 


12.6 RELATAND0 OS RESULTAD0S DA 
AN0VA MISTA © 

Quando voce tern mais do que duas varia- 
veis independentes, ha muita informacao para 
relatar. Voce deve relatar todos os efeitos prin¬ 
cipals, todas as interagoes e qualquer contraste 
que tenha feito. Isso pode tomar muito espaco, 
e uma boa dica e reservar os detalhes para os 
efeitos que realmente importam (isto e, os efei¬ 
tos principals em geral nao sao muito interes- 
santes se voce tern uma i ntcracao significativa 
que inclui aquela variavel). Sou um grande fa 
de dar breves explicagoes dos resultados para 


que voce entenda o que o efeito esta dizendo, 
assim, tenho a tendencia de relatar nao somen- 
te os resultados, mas tambem alguma interpre- 
tagao. Alguns editores adoram me dizer que as 
minhas segoes de resultados sao muito gran¬ 
des. Portanto, provavelmente voce deve igno- 
rar tudo o que eu disse. Presumindo que voce 
queira relatar todos os seus efeitos, pode fazer 
algo assim (embora nao como uma lista!): 

/ Todos os efeitos sao relatados como sig¬ 
nificativos a p < 0,05. Havia um efeito 
significativo da atratividade do acompa- 
nhante no interesse expressado pelo parti- 
cipante, F (2, 36) = 423,73. Os contrastes 
revelaram que acompanhantes atraentes 
eram mais desejados do que os de aparen¬ 
cia mediana, F (1, 18) = 226,99, r = 0,96 
e os acompanhantes feios eram menos de¬ 
sejados do que os de aparencia mediana, 
F{ 1, 18) = 160,07, r = 0,95. 

/ Houve, tambem, um efeito significativo 
do carisma do acompanhante no interesse 
em sair com eles, F (2, 36) = 328,25. Os 
contrastes revelaram que acompanhantes 
com muito carisma eram mais desejados 
do que os acompanhantes com pouco ca¬ 
risma F (1, 18) = 109,94, r= 0,93, e cha- 
tos eram menos desejados do que acom¬ 
panhantes com pouco carisma, F (1, 18) 
= 227,94, r = 0,96. 

/Nao houve um efeito significativo do ge¬ 
nera indicando que as avaliacoes dos par¬ 
ticipates homens e mulheres eram geral- 
mente as mesmas, F (1,18) < 1, r = 0,02. 

/ Houve um efeito de interagao significati¬ 
vo entre a atratividade do acompanhante 
e o genera do participate, F (2, 36) = 
80,43. Isso indica que a vontade de sair 
com acompanhantes dos diferentes nf- 
veis de atratividade diferia em homens 
e mulheres. Para analisar essa interagao, 
contrastes foram feitos comparando cada 
nlvel de atratividade a aparencia mediana 
em participantes homens e mulheres. Isso 
revelou interagdes significativas quando 
comparando os escores dos homens e 
mulheres para acompanhantes atraentes 
em relagao aos de aparencia mediana, F 
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(1, 18) = 43,26, r = 0,84 e para acom- 
panhantes feios comparados aos de apa¬ 
rencia mediana, F (1, 18) = 30,23, r = 
0,79. Observando o grafico de intera 9 ao, 
as avaliacdes dos homens e mulheres sao 
muito similares para acompanhantes de 
aparencia mediana, mas os homens dao 
mais valor a acompanhantes atraentes do 
que as mulheres, enquanto as mulheres 
dao mais valor aos acompanhantes feios 
do que os homens. Embora tanto o inte- 
resse dos homens quanto o das mulheres 
diminua a medida que a atratividade di- 
rninui, esse decrescimo foi rnaior nos ho¬ 
mens, sugerindo que quando o carisma e 
ignorado, o interesse dos homens em sair 
com uma pessoa e mais influenciado pela 
sua aparencia do que para as mulheres. 

/ Houve um efeito de interacao significati¬ 
ve entre o nlvel de carisma do acompa- 
nhante e o genero do participate, F (2, 
36) = 62,45. Isso indica que a vontade de 
sair com acompanhantes dos diferentes 
nlveis do carisma foi diferente em homens 
e mulheres. Para analisar essa interagao, 
contrastes foram feitos comparando cada 
nlvel do carisma a categoria “pouco ca¬ 
risma” entre participantes homens e mu¬ 
lheres. Isso revelou interagoes significa- 
tivas quando comparando os escores dos 
homens e mulheres para acompanhantes 
muito carismaticos e acompanhantes com 
pouco carisma, F (1, 18) = 27,20, r = 
0,78, e para chatos comparados a acom¬ 
panhantes com pouco carisma, F (1, 18) 
= 33,69, r = 0,81. O grafico de interacao 
mostra que os homens demonstram mais 
interesse em acompanhantes que sao cha¬ 
tos do que as mulheres e as mulheres de¬ 
monstram um interesse levemente maior 
em acompanhantes muito carismaticos do 
que os homens. O interesse tanto dos ho¬ 
mens quanto das mulheres diminui a me¬ 
dida que o carisma diminui, mas esse de¬ 
crescimo e maior em mulheres, sugerindo 
que o interesse das mulheres em sair com 
uma pessoa e mais influenciado pelo seu 
carisma do que para os homens. 


/ Houve um efeito de interacao significativo 
entre o nlvel do carisma do acompanhante e 
a atratividade do acompanhante F (4, 72) = 
36,63. Isso indica que a vontade de sair com 
os acompanhantes dos diferentes nlveis de 
carisma diferiu de acordo com sua atrativi¬ 
dade. Para analisar essa interacao, foram 
feitos contrastes comparando cada nlvel do 
carisma com a categoria do meio (pouco 
carisma) ao longo de cada nlvel da atrativi¬ 
dade comparado a categoria de atratividade 
mediana. O primeiro contraste revelou uma 
interacao significativa na comparagao entre 
acompanhantes atraentes e os de aparen¬ 
cia mediana quando o acompanhante tinha 
muito carisma em relagao a pouco carisma, 
F (1, 18) = 21,94, r = 0,74, e nos infor- 
mou que a medida que os acompanhantes 
se tornam menos atraentes, existe um gran¬ 
de decllnio no interesse quando o carisma 
e pouco comparado com quando o carisma 
e muito. O segundo contraste comparou 
acompanhantes atraentes aos acompanhan¬ 
tes de aparencia mediana quando o acom¬ 
panhante era chato em relatjao a quando ele 
tinha pouco carisma. Isso nao foi significa¬ 
tivo, F (1, 18) = 4,09, r = 0,43, e indica 
que a medida que os acompanhantes se 
tornam menos atraentes, existe um decllnio 
no interesse quando o carisma e baixo ou 
nulo. O terceiro contraste comparou acom¬ 
panhantes feios aos acompanhantes de apa¬ 
rencia mediana quando os acompanhantes 
tinham muito carisma em relagao a pouco 
carisma. Isso foi significativo, F (1, 18) = 
6,23, r = 0,51, e indica que a medida que 
os acompanhantes se tornam menos atraen¬ 
tes, existe um grande decllnio no interesse 
quando o carisma e pouco comparado com 
quando o carisma e muito. O contraste fi¬ 
nal comparou acompanhantes feios aos de 
aparencia mediana quando o acompanhan¬ 
te era chato em rela 9 ao a quando ele tinha 
pouco carisma. Esse contraste foi altamente 
significativo, F(l, 18) = 88,60, r= 0,91. e 
informa que a medida que os acompanhan¬ 
tes se tornam menos atraentes, o decllnio 
no interesse em acompanhantes com pouco 
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carisma e significativamente maior do que 
para os chatos. 

/ Finalmente, a interacao aparencia x ca¬ 
risma x genero foi significativa, F (4, 72) 
= 24,12. Isso indica que a interagao apa¬ 
rencia x carisma descrita previamente foi 
diferente em participantes homens e mu- 
lheres. Novamente, contrastes foram usa- 
dos para analisar essa interacao; esses con¬ 
trastes compararam os escores dos homens 
e mulheres em cada nlvel do carisma em 
relacao a categoria do meio de “pouco ca¬ 
risma” atraves de cada nlvel de atratividade 
comparado com a categoria da atrativida¬ 
de mediana. O primeiro contraste revelou 
uma diferenga nao significativa entre as 
respostas dos homens e mulheres quando 
relacionando os acompanhantes atraentes 
aos de aparencia mediana quando o acom- 
panhante tinha alto carisma comparado a 
pouco carisma, F ( 1, 18) <1, r = 0,22, e 
indica que para os homens e as mulheres, 
a medida que os acompanhantes se tornam 
menos atraentes, existe um grande declmio 
no interesse quando o carisma e baixo com¬ 
parado ao muito carisma. O segundo con¬ 
traste investigou diferengas entre homens 
e mulheres relacionando acompanhantes 
atraentes aos de aparencia mediana quando 
os acompanhantes eram chatos comparado 
aos com pouco carisma. Isso foi significa¬ 
tive, F(l, 18) = 60,67, r = 0,88, e informa 
que para acompanhantes com pouco caris¬ 
ma, a redugao no interesse a medida que a 
atratividade diminui e quase a mesma para 
homens e mulheres, mas para acompa¬ 
nhantes chatos, o decrescimo no interesse 
se esses acompanhantes sao de aparencia 
mediana em vez de atraentes e muito maior 
em homens do que em mulheres. O terceiro 
contraste buscou diferengas entre homens 
e mulheres quando comparando acompa¬ 
nhantes feios aos de aparencia mediana 
quando o acompanhante tinha muito caris¬ 
ma em relagao a pouco carisma. Esse foi 
significativo, F (1, 18) = 11,70, r = 0,63, 
e indica que para os acompanhantes com 
pouco carisma, a redugao no interesse a 


medida que a atratividade diminui e quase 
a mesma em homens e mulheres, mas para 
acompanhantes que tem pouco carisma, 
o decrescimo no interesse se os acompa¬ 
nhantes sao feios em vez de com aparencia 
mediana e muito maior em homens do que 
em mulheres. O ultimo contraste procurou 
diferengas entre homens e mulheres quan¬ 
do comparando acompanhantes feios aos 
de aparencia mediana quando o acompa¬ 
nhante era chato comparado a um que ti¬ 
nha pouco carisma. Esse contraste nao foi 
significativo, F (1, 18) = 1,33, r = 0,26, e 
indica que, tanto para homens quanto para 
mulheres, a medida que os acompanhantes 
se tornam menos atraentes, o declmio no 
interesse em acompanhantes com um pou¬ 
co de carisma e significativamente maior 
do que para os chatos. 

12.7 0 QUE DESC0BRIM0S S0BRE 
ESTATISTICA? © 

A ANOVA de tres fatores e muito diflcil de 
decifrar. Ja fiz centenas de ANOVAs de tres fa- 
tores na minha vida e mesmo assim foi compli- 
cado escrever este capitulo (portanto, se voce es- 
tiver confuso apos ler este capitulo, a culpa nao 
e sua, e minha). Com sorte, voce deve ter desco- 
berto que esse tipo de ANOVA e flexlvel o sufi- 
ciente para que voce possa misturar e relacionar 
variaveis independentes que sao mensuradas 
usando os mesmos ou diferentes participantes. 
Alem disso, observamos como a ANOVA e tam- 
bem flexlvel o bastante para ir alem de simples- 
mente incluir duas variaveis independentes. Es- 
pero que voce tambem tenha entendido por que 
existem boas razoes para limitar o numero de 
variaveis independentes que voce inclui (para o 
bem da interpretagao). E, e claro, voce aprendeu 
que os homens sao criaturas superficiais que 
preferem aparencia ao carisma e que as mulhe¬ 
res sairiam ate com o corcunda de Notre Dame 
se ele tivesse carisma o suficiente. Agora vamos 
diminuir um pouco o ritmo e observar testes que 
podemos usar quando as hipoteses necessarias 
para os testes parametricos sao violadas e nao 
podem ser corrigidas. 
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12.8 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• ANOVA mista 

• Delineamento misto 


12.9 TAREFAS DO ALEX ESPERTO 



• Tarefa 1: Estenderei o exemplo 
do capftulo anterior (propagan¬ 
da e imagens diferentes) acres- 
centando uma variavel entre 
grupos ao delineamento. 4 Re- 
capitulando, no caso de voce nao ter lido o 
capftulo anterior, os participantes assisti- 
ram a um total de nove comerciais falsos 
durante tres sessdes. Nesses comerciais, 
havia tres produtos (uma marca de cerveja, 
Brain Death, uma marca de vinho, Dangle- 
berry, e uma marca de agua, Puritan). Elas 
poderiam ser apresentadas com imagens 
positivas, negativas e neutras. Durante as 
tres sessoes e nove comerciais, cada tipo 
de produto foi apresentado com um tipo de 
imagem (leia o ultimo capftulo se voce 
precisar de mais detalhes). Apos cada co- 
mercial, os participantes avaliaram as be- 
bidas numa escala variando de —100 (de¬ 
testa) passando por 0 (neutro) a 100 (gosta 
muito). O delineamento, ate agora, tern 
duas variaveis independentes: o tipo de be- 
bida (cerveja, vinho e agua) e o tipo de 
imagem utilizada (positiva, negativa ou 
neutra). Essas duas variaveis se sobrepoem 
completamente produzindo nove condi- 
g5es experimentais. Agora imagine que eu 
tambem anotei o genera de cada pessoa. 
Depois da analise do capftulo anterior, me 
ocorreu que homens e mulheres podem ter 
uma resposta diferente aos produtos (por- 
que, conforme o estereotipo, os homens, 
na sua maioria, gostam mais de cerveja e 
as mulheres, de vinho). Portanto, gostaria 
de analisar novamente os dados levando 


em considcracao essa variavel adicional. O 
genera e uma variavel entre grupos porque 
um participante pode ser somente homem 
ou mulher: eles nao podem participar como 
homem e depois trocar para mulher e parti¬ 
cipar novamente! Os dados sao os mesmos 
do capftulo anterior (Tabela 11.3) e estao 
no arquivo MixedAttitude.sav. Execute 
uma ANOVA mista com esses dados. © 

• Tarefa 2: Mensagens de texto sao muito 
populares entre donos de telefones celula- 
res, a ponto de livros sobre como escrever 
em linguagem de texto terem sido publi- 
cados (espero q vc saiba o q eu kero dizer 
com linguagem de txtu). Ha uma preocu- 
pagao de que as criancas usem muito essa 
forma de comunicacao e isso atrapalhe a 
sua habilidade de aprender o idioma cor- 
retamente. Um pesquisador conduziu um 
experimento no qual um grupo de crian- 
gas foi incentivado a mandar mensagens 
de texto dos seus celulares por um perfodo 
de seis meses. O segundo grupo foi proi- 
bido de mandar mensagens de texto pelo 
mesmo perfodo. Para assegurar que as 
criangas desse ultimo grupo nao usassem 
seus celulares, foram colocadas bracadci- 
ras que administravam choques doloridos 
na presenga de micro-ondas (como as 
emitidas dos celulares) 5 . Havia 50 partici¬ 
pantes diferentes: 25 foram incentivados 
a enviar mensagens de texto e 25 foram 
proibidos. A safda foi um escore num tes¬ 
te de gramatica (como uma percentagem), 
mensurada antes e depois do experimento. 
A primeira variavel independente foi, por¬ 
tanto, o uso da mensagem de texto (text 
messagers versus controls)( mensagens de 
texto versus controle)) e a segunda varia¬ 
vel independente foi o perfodo em que a 
habilidade gramatical foi avaliada (antes 
e depois do experimento). Os dados estao 
no arquivo TextMessages.sav. ® 


4 Anteriormente, o exemplo continha duas variaveis de 
medidas repetidas (tipo de bebida e tipo de imagem), 
mas agora ele ira incluir tres variaveis (duas medidas 
repetidas e uma entre grupos). 


5 Embora isso as punisse por qualquer tentativa de uso 
do celular, porque os celulares de outras pessoas tam¬ 
bem emitem microondas; um efeito colateral infeliz foi 
que essas criangas adquiriram um medo patologico de 
qualquer pessoa usando um celular! 
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As respostas estao no arquivo Answers 
(Chapterl2).pdf. dispomvel no site www. 
artmed.com.br. Alguns comentarios mais de- 
talhados sobre a tarefa 2 podem ser encontra- 
dos em Field e Hole (2003). 


12.10 LEITURAS COMPLEMENTARES 

HOWELL, D. C. Statistical methods for psychology. 
Belmont (CA): Duxbury. 2002. 5“ edigao. 



13 

TESTES NAO PARAMETRICOS 


13.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 

Vimos nos ultimos 
capftulos como utilizar 
varias tecnicas para 
determinar diferengas 
entre medias. Contu- 
do, todos os testes 
apresentados tem por 
base hipoteses para- 
metricas (principal- 
mente dados normalmente distribufdos). No 
Capftulo 3, vimos que os dados nem sempre 
sao tao amigaveis nem aparecem em pacotes 
normalmente distribufdos. Ainda, nem sem¬ 
pre e possfvel corrigir os problemas da distri- 
buigao dos dados. O que fazer nesses casos? 
A resposta e que devemos utilizar procedi- 
mentos estatfsticos especiais chamados de 
testes nao-parametricos. Esses testes sao tam- 
bem conhecidos como testes de distribuigao 
livre porque fazem poucas - ou nenhuma - 
suposigoes sobre o tipo de dados que pode ser 



utilizado. 1 Muitos desses testes trabalham 
com a ideia de categorizar os dados: isto e, 
encontrar o menor valor e atribuir a ele um 
posto (posigao) 1, achar o proximo maior va¬ 
lor e atribuir a ele o posto 2 e assim por dian- 
te. Esse processo resulta em escores altos sen- 
do representados por altos postos e escores 
baixos sendo representados por postos baixos. 
A analise e entao executada sobre os postos 
(ranks) em vez de sobre os dados observados. 
O processo e uma forma engenhosa de utilizar 
dados que nao se encaixam nas hipoteses para- 
metricas. Algumas pessoas acreditam que 
os testes parametricos tem menos poder do 
que seus contrapartes parametrico, mas como 
veremos no Quadro 13.2, isso nem sempre e 
verdadeiro. Neste capftulo, veremos quatro dos 
procedimentos nao-parametricos mais comuns: 
os testes de Mann-Whitney, por postos de 
Wilcoxon, de Friedman e de Kruskal-Wallis. 
Para cada um deles, iremos descobrir como 
realizar a analise com o SPSS e como interpre¬ 
tar e relatar os resultados. 


1 Testes nao-parametricos sao normalmente denomina- 
dos testes de distribuigao livre, com a cxplicagao de 
que nao e necessario suposigoes sobre a distribuigao 
dos dados. Tecnicamente isso nao e verdadeiro: eles de 


fato exigem hipoteses sobre distribnicoes (por exem- 
plo, todos os deste capftulo pressupoem que a distribui- 
§ao e continua), mas eles sao menos restritivos que os 
parametricos. 
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13.2 COMPARANDO DUAS CONDigOES 
INDEPENDENTES: 0 TESTE DA 
SOMA DOS POSTOS DE WILCOXON 
E 0 TESTE DE MANN-WHITNEY © 

Quando queremos testar diferen 9 as en- 
tre duas condicoes e diferentes participantes 
foram selecionados em cada condic^ao, temos 
duas escolhas: o teste de Mann-Whitney 
(Mann e Whitney, 1947) e o teste da soma 
dos postos de Wilcoxon (Wilcoxon, 1945). 
Esses testes sao as versoes nao-parametricas 
equivalentes ao teste parametrico t (Student). 
De fato, os dois testes sao equivalentes e ainda 
existe outro, mais famoso, o teste de Wilcoxon 
- e dificil nao nos sentirmos confusos. 

Por exemplo, uma neurologista quer rea- 
lizar um experimento para investigar o efeito 
depressivo de determinada substancia usada 
para o divertimento. Ela testou, ao todo, 20 
frequentadores de boates: a 10 deles foi dado 
um tablete de ecstasy para tomar no sabado 
a noite e aos outros 10 foi permitido ingerir 
somente alcool. Os nfveis de depressao foram 
mensurados utilizando o BDI (Inventario de 
Depressao de Beck, BDI - Beck Depression 
Inventory) no dia posterior e no meio da sema- 
na. Os dados estao na Tabela 13.1. 


13.2.1 Teoria 



A logica por tras dos testes 
da soma de postos de Wilcoxon 
e de Mann-Whitney sao incri- 
velmente elegantes. Primeiro, 
vamos imaginar um cenario 
onde nao existem diferengas nos nfveis de de¬ 
pressao entre os usuarios de ecstasy e alcool. 
Se fossemos organizar (ordenar) os dados ig- 
norando a qua! grupo a pessoa pertence a par- 
tir do menor para o maior (isto e, atribuindo ao 
menor valor o posto 1 e ao proximo o posto 2 e 
assim por diante), o que deverfamos encontrar? 
Bern, se nao existe difcrenca entre os dois gru- 
pos, esperarfamos encontrar um numero seme- 
lhante de postos altos e baixos em cada grupo; 
especificamente, se somarmos os postos, espe¬ 
rarfamos que a soma total dos postos em cada 
grupo fosse aproximadamente a mesma. 



Figura 13.1 Frank Wilcoxon. 


Tabela 13.1 Dados para o experimento com 
substancias 


Participante 

Droga 

BDI 

(Domingo) 

BDI 

(Quarta) 

1 

Ecstasy 

15 

28 

2 

Ecstasy 

35 

35 

3 

Ecstasy 

16 

35 

4 

Ecstasy 

18 

24 

5 

Ecstasy 

19 

39 

6 

Ecstasy 

17 

32 

7 

Ecstasy 

27 

27 

8 

Ecstasy 

16 

29 

9 

Ecstasy 

13 

36 

10 

Ecstasy 

20 

35 

11 

Alcool 

16 

5 

12 

Alcool 

15 

6 

13 

Alcool 

20 

30 

14 

Alcool 

15 

8 

15 

Alcool 

16 

9 

16 

Alcool 

13 

7 

17 

Alcool 

14 

6 

18 

Alcool 

19 

17 

19 

Alcool 

18 

3 

20 

Alcool 

18 

10 


Agora pense sobre o que aconteceria se 
existisse uma diferenca entre os dois grupos. 
Vamos imaginar que o grupo do ecstasy tenha 
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mais depressivos do que o do alcool. Se repe- 
tirmos o procedimento anterior, esperarfamos 
que os postos maiores estivessem no grupo 
do ecstasy e os postos mais baixos no grupo 
do alcool. Novamente, se somarmos os pos¬ 
tos de cada grupo, esperarfamos que a soma 
dos postos fosse maior no grupo do ecstasy 
do que no do alcool. 

Os testes de Mann-Whitney e da soma de 
postos de Wilcoxon trabalham com essa ideia. 
De fato, quando os grupos apresentam um nu- 
mero diferente de participantes, a estatfstica 
teste (W s ) para o teste da soma dos postos de 
Wilcoxon e simplesmente a soma dos postos 
no grupo que contem o menor numero de par¬ 
ticipantes; quando os tamanhos dos grupos 
sao iguais, a estatfstica e a menor das duas 
somas. Vamos dar uma olhada em como isso 

A Figura 13.2 mos- 
tra o processo de ob- 
tencao dos postos tanto 
para os dados do do- 
mingo quanto para os 
da quarta-feira. Para 
comecar, vamos utili- 
zar os dados da quar¬ 
ta-feira. Organize os 
dados em ordem crescente, colocando um rotu- 
lo em cada valor para saber a que grupo eles 
pertencem (eu uso A para o grupo do alcool e E 
para o do ecstasy). Depois, partindo do menor 
valor, atribua o postos potenciais comegando 
com o valor 1 e aumentando ate o total existen- 
te de dados. A razao para acrescentar o termo 
potencial aos postos e que algumas vezes o 
mesmo valor ocorre mais de uma vez no con- 
junto global de dados (por exemplo, o valor 6 
ocorre duas vezes e o valor 35, tres). Nesse 
caso, temos um empate de valores e precisamos 
atribuir a eles o mesmo posto, assim, o que fa- 
zemos e atribuir um posto que e a media dos 
postos potenciais para esses valores. Desse 
modo, com os dois valores 6, em virtude de 
eles terem postos potenciais de 3 e 4, iremos 
atribuir a eles a media desses dois postos (3,5) 
e utilizar esse mesmo valor para as duas ocor- 
rencias desse escore. Faremos o mesmo com o 



valor 35 que apresenta postos potencias de 16, 
17 e 18; o posto utilizado sera o valor medio 
desses tres postos potenciais, isto e, (16 + 17 + 
18)/3 = 17. Quando tivermos terminado de or- 
denar os dados, somamos os postos de cada um 
dos dois grupos. Assim, some os postos dos es- 
cores do grupo do alcool (voce deve encontrar 
o valor 59) e fag a o mesmo para o grupo do 
ecstasy (esse valor devera ser 151). Tomamos a 
menor dessas duas somas como nossa estatfsti¬ 
ca teste; dessa forma, a estatfstica de Wilcoxon 
para os dados de Quarta-Feira e W s = 59. 

Agora, como faremos o mesmo com os 
dados de domingo, que apresentam muitos 
empates e e geralmente horrfvel! A resposta 
esta na Figura 13.2; voce deve encontrar que 
quando ordenar os dados e somar os postos 
para os dois grupos, a soma dos postos para 
o grupo do Alcool e 90,5 e para o grupo de 
Ecstasy, 119,5. Tomamos o menor dessas 
duas somas como nossa estatfstica; portanto, 
a estatfstica teste para os dados de domingo e 
W s = 90,5. 

A proxima questao e: como determinar se 
esse valor e significativo? Sabemos que a me¬ 
dia (W s ) e o erro padrao dessa estatfstica (EP Ws ) 
podem ser facilmente calculados a partir dos 
tamanhos dos dois grupos (n t sendo o tamanho 
do grupo 1 e n 2 o tamanho do grupo 2): 


— _ ni(ni + « 2 + l) 


EPn, 


«i«2(ni+«2 + l) 


12 


Para os nossos dados que, de fato, apre¬ 
sentam grupos de mesmo tamanho com 10 
pessoas em cada um, entao n t = n 2 = 10. Por¬ 
tanto, a media e o erro padrao sao: 


W s = 
Ep w s = 


10(10 + 10 + 1 ) 


105 


(10xl0)(10 + 10 + l) 


12 


13,23 


Se soubermos a estatfstica teste, a media 
e o erro padrao da estatfstica teste, podemos 
facilmente converter a estatfstica teste em um 
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Dados de quarta-feira 


Escore 

3 

5 

6 

6 

7 

8 

9 

10 

17 

24 

27 

28 

29 

30 

32 

35 

35 

35 

36 

39 

Posto 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

















V 


y 




















V 




Posto Real 

1 

2 

3.5 

3.5 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

17 

17 

17 

19 

20 

Grupo 

A 

A 

A 

A 

A 

A 

A 

A 

A 

E 

E 

E 

E 

A 

E 

E 

E 

E 

E 

E 


Soma dos postos para o Alcool (A) = 59 Soma dos postos para o Ecstasy (E) = 151 


Dados de domingo 


Escore 

13 

13 

14 

15 

15 

15 

16 

16 

16 

16 

17 

18 

18 

18 

19 

19 

20 

20 

27 

35 

Posto 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 







J 






V 


y 












V 



'V' 




V 








Posto Real 

1.5 

1.5 

3 

5 

5 

5 

8.5 

8.5 

8.5 

8.5 

11 

13 

13 

13 

15.5 15.5 17.5 

17.5 

19 

20 

Grupo 

A 

E 

A 

A 

A 

E 

A 

A 

E 

E 

E 

E 

A 

A 

E 

A 

E 

A 

E 

E 


Soma dos postos para o Alcool (A) = 90,5 Soma dos postos para o Ecstasy (E) = 119,5 
Figura 13.2 Postos dos escores de depressao de quarta-feira. 


escore-z, utilizando a equa^ao que ja foi vista 
no Capftulo 1: 

= x-x_ = w lZ m 

s EP Ws 

Se calcularmos esses valores para os es¬ 
cores de depressao de domingo e quarta-feira, 
obteremos: 


Mann-Whitney, com o qual muitos de voces ja 
estao familiarizados, e basicamente o mesmo. 
Ele e baseado na estatistica U, derivada de modo 
semelhante ao procedimento de Wilcoxon (de 
fato, existe um relacionamento direto entre os 
dois). Se voce esta interessado, U e calculado 
utilizando uma equa^ao na qual nj e n 2 sao os 
tamanhos dos grupos 1 e 2, respectivamente, e 
Rj e a soma dos postos para o grupo 1: 


_ W t -W s 

^Domingo — 

EP Ws 


ZQuarta — 


w s -w s 

Ep w s 


90,5-105 

13,23 


= 1,10 


59-105 

13,23 


-3,48 


Se esses valores sao maiores do que 1,96 
(ignorando o sinal de menos), o teste e signifi- 
cativo no nfvel de p < 0,05. Assim, parece que 
existe uma diferenga significativa entre os gru¬ 
pos na quarta-feira, mas nao no domingo. 

O procedimento que descrevemos e o tes¬ 
te da soma dos postos de Wilcoxon. O teste de 


U = NiN 2 + 


M(M + 1) 


Ri 


Assim, para nossos dados obteremos o se- 
guinte (lembre que temos 10 pessoas em cada 
grupo e que a soma dos postos para o grupo 1, 
o de Ecstasy, foi 119,5 para os dados de do¬ 
mingo e 151 para os dados de quarta-feira): 


(^Domingo = (10x10) + 

t/ Q u.«a = 00X10) + 


1001 ) 

2 

10 ( 11 ) 


-119,50 = 35,50 


-151,00 = 4,00 


2 
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O SPSS produz as duas 
estatfsticas e existe um relacio- 
namento direto entre as duas, 
portanto, nao importa qual de- 
las for utilizada! 


13.2.2 Atribuindo dados e analise 
provisional © 

Quando os dados sao coletados com um 
numero diferente de participantes em cada gru- 
po, precisamos entrar com os dados utilizando 
uma variavel codificadora. Assim, o editor de 
dados tera tres colunas de dados. A primeira 
coluna sera a variavel codigo (que pode ser de- 
nominada drug (droga)) que, nesse caso, tera 
somente dois valores (por conveniencia, sugiro 

1 = grupo do Ecstasy e 2 = grapo do Alcool). 
A segunda coluna apresentara os valores da va¬ 
riavel dependente (BDI) medida no dia seguin- 
te (chame essa variavel de sunbdi) e a terceira 
tera os escores do meio da semana do mesmo 
questionario (chame essa variavel de wedbdi). 

Quando voce inserir os dados no SPSS, 
informe ao computador que o codigo 1 re- 
presenta o grupo do Ecstasy e que o codigo 

2 representa o grupo do Alcool (veja a Segao 
2.4.4). Nao existe uma previsao especffica so- 
bre qual droga tera o maior efeito e, assim, a 
analise deve ser bilateral. Primeiro, podemos 
rodar uma analise exploratoria nos dados e, 
em virtude de estarmos procurando diferengas 
entre os grupos, precisamos fazer essa analise 
exploratoria para cada um dos grupos (veja as 
Segoes 3.5 e 3.6). Se voce fizer essas analises 
devera encontrar tabelas identicas as apresenta- 
das na Saida 13.1 do SPSS. Essas tabelas mos- 
tram primeiro que para os dados de domingo 
a distribuigao para o Ecstasy, D(10) = 0,28, p 
< 0,05, parece nao ser normal enquanto a dos 
dados do Alcool, D(10) = 0,17, ns, e normal: 
podemos dizer isso se a significancia dos testes 
K-S e Shapiro-Wilk sao menores do que 0,05 
(e, dessa forma, significativas) ou maior do 
que 0,05 (e, portanto, nao-significativas (ns)). 
Para os dados de quarta-feira, embora os dados 
para o Ecstasy sejam normais, D(10) = 0,24, 
ns, os dados para o Alcool parecem ser signi- 
ficativamente nao-normais D(10) = 0,31. p < 


0,01. Esses achados nos alertam para o fato de 
que um teste nao-parametrico deve ser utiliza- 
do nos dados de domingo e quarta-feira porque 
uma das variaveis de cada nao e normalmente 
distribuida. Voce deve notar que a estatistica de 
Shapiro-Wilk fornece valores com significan¬ 
cia exata enquanto o teste K-S, as vezes, forne¬ 
ce uma aproximagao de 0,2 para a significancia 
(veja os dados de domingo para o grupo do Al¬ 
cool), porque o SPSS nao pode calcular signifi- 
cancias exatas. Esse fato ressalta uma diferenga 
importante entre os testes K-S e Shapiro-Wilk: 
em geral, o teste de Shapiro-Wilk e mais pre- 
ciso. A segunda tabela na Saida 13.1 do SPSS 
mostra os resultados do teste de Levene. Para 
os dados de domingo F(l, 18) = 3,64, ns, e 
para os de quarta-feira, F(l, 18) 0,51, ns, as va- 
riancias nao sao significativamente diferentes, 
indicando que a hipotese de homogeneidade 
foi satisfeita. Nao obstante, precisamos utilizar 
procedimentos estatisticos nao-parametricos 
nos dados de domingo e quarta-feira em virtu¬ 
de da nao normalidade dos dados. 


13.2.3 Executando a analise ® 

Primeiro, acesse a caixa de dialogo prin¬ 
cipal utilizando o seguinte caminho (menu) 
A nalvze=>Non parametric Tests=>2 Inde¬ 
pendent Samples... (Analisar=>Testes nao- 
-parametricos=>Duas Amostras Independen- 
tes...) (veja a Figura 13.3). Com essa caixa 
de dialogo ativada, selecione as duas variaveis 
dependentes da lista (clique no Inventario de 
Depressao de Beck domingo [sunbdi], de- 
pois, pressionando o botao do mouse, arraste 
Inventario de Depressao de Beck quarta-feira 
[wedbdi] e transfira as duas para o quadro 
denominado Test Varible List (Lista de Va¬ 
riaveis de Teste) clicando em _J. A seguir, se¬ 
lecione a variavel independente (a variavel de 
grupo) - nesse caso, drug (tipo de droga) - e 
transfira-a para o quadro denominado Grou¬ 
ping Variable (Variavel de Agrupamento). 
Quando tiver feito isso, o botao i- 1 - 0 -- ficara 
ativo e voce deve clicar nele para ativar a cai¬ 
xa de dialogo define groups (deftnir grupos). 
O SPSS precisa saber quais codigos voce atri- 
buiu para cada grupo e existe um espago para 
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Saida 13.1 do SPSS 

Tests of Normality (Testes de Normalidade) 




Kolmogorov-Smirnov 

Shapiro-Wilk 


Type of Drug 
(Tipo de Droga) 

Statistic 

(Estatistica) 

df 

(gi) 

Sig. 

(Sig.) 

Statistic 

(Estatistica) 

df 

(gi) 

Sig. 

(Sig.) 

Beck Depression Inventory 
(Sunday) 

Ecstasy ( Ecstasy ) 

0.276 

10 

0.030 

0.811 

10 

0.020 

(Inventario de Depressao de 

Beck (Domingo)) 

Alcohol (Alcool) 

0.170 

10 

0.200* 

0.959 

10 

0.780 

Beck Depression inventory 
(Wednesday) 

Ecstasy ( Ecstasy ) 

0.235 

10 

0.126 

0.941 

10 

0.566 

(Inventario de Depressao de 

Beck (Quarta-feira)) 

Alcohol (Alcool) 

0.305 

10 

0.009 

0.753 

10 

0.004 


* This is a lower bound of the true significance (Esse e um limite inferior da verdadeira significance) 
a Lilliefors Significance Correction (Corregao da significance de Lilliefors) 


Test of Homogeneity of Variance (Teste de Homogeneidade da Variancia) 



Levene Statistic 
(Estatistica de Levene) 

dfl 

(gii) 

df2 (gl2) 

Sig. 

(Sig.) 

Beck Depression Based on Mean (Com base na Media) 

3.644 

1 

18 

0.072 

Inventory (Sun- Based on Median (Com base na mediana) 

1.880 

1 

18 

0.187 

day) (Inventario Based on Median and with adjusted df 

de Depressao de (Com base na mediana e com gl ajustado) 

Beck (Domingo)) 

1.880 

1 

10.076 

0.200 

Based on on trimmed mean (Com base na 
media interna) 

2.845 

1 

18 

0.109 

Beck Depres- Based on Mean (Com base na Media) 

0.508 

1 

18 

0.485 

sion Inventory Based on Median (Com base na mediana) 

0.091 

1 

18 

0.766 

(Wednesday) Based on Median and with adjusted df 

(Inventario de De- (Com base na mediana e com gl ajustado) 
pressao de Beck 
(Quarta-feira)) 

0.091 

1 

11.888 

0.768 

Based on trimmed mean (Com base na 
media interna) 

0.275 

1 

18 

0.606 


digitar esses valores. Nesse exemplo, o grupo 
do Ecstasy foi codificado como 1 e o grupo do 
Alcool, como 2, e voce deve digitar esses dois 
valores nos espacos apropriados. Quando tiver 
definido os grupos, clique em para retor- 
nar a caixa de dialogo principal. Essa caixa 
fornece tambem opcdes para realizar outros 
testes alem do de Mann-Whitney e essas alter- 
nativas sao apresentad as no Qu adro 13.1. 

Se voce clicar em E,acl I . outra caixa de 
dialogo aparecera. 2 Por padrao, o SPSS cal- 


2 Esse botao aparecera somente se voce tiver o modulo 
Exact tests (Testes exatos) do SPSS instalado. Lembre 
disso tambem nas proximas segoes. 


cula a significancia do teste de Mann-Whit¬ 
ney utilizando um metodo que e preciso com 
amostras grandes (denominado Asympto¬ 
tic Method (Metodo Assintotico); contudo, 
quando as amostras sao pequenas, ou os dados 
sao pobremente distribufdos, metodos mais 
precisos estao dispom'veis. A melhor opcao e 
solicitar um teste exato (Exact), que calcula 
a significancia do teste de Mann-Whitney de 
forma exata. Contudo, existe um prego para 
obter tal precisao e, em virtude da complexi- 
dade dos calculos, o SPSS pode demorar para 
encontrar uma solugao, especialmente com 
grandes amostras. Um metodo menos traba- 
lhoso e estimar a significancia utilizando o 
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Figura 13.3 Caixas de dialogo para o teste de Mann-Whitney. 


Quadro 13.1 


Outras opgoes para o teste de Mann-Whitney © 

Na caixa de dialogo principal existem algumas outras opgoes que podem ser selecionadas: 

• 0 teste de Kolmogorov-Smirnov (Kolmogorov-Smirnov Z): No Capitulo 3, aprendemos 
sobre o teste de Kolmogorov-Smirnov, utilizado para testar se uma populagao era nor- 
malmente distribuida. Esse e um teste diferente! De fato, ele testa se dois grupos foram 
retirados de uma mesma populagao (nao importando o tipo de populagao). Isso significa 
que ele e muito semelhante ao teste de Mann-Whitney! Contudo, o teste K-S tende a ter 
mais poder do que o de Mann-Whitney quando os tamanhos amostrais sao inferiores a 25 
por grupo. Assim, vale a pena seleciona-lo se esse for o caso. 

• Reagoes extremas de Moses (Moses Extreme Reactions)'. Grande nome - me faz pensar 
em um homem barbudo no alto do Monte Sinai lendo umas tabuas de pedra e que, su- 
bitamente irado, quebra as tabuas e grita: "o que voce quer dizer com nao louvar outro 
Deus?". Infelizmente, esse teste nao e tao excitante quanto a minha imaginagao. Ele ba- 
sicamente compara a variabilidade dos escores nos dois grupos, assim, ele e um pouco 
semelhante ao teste nao-parametrico de Levene. 

• Corridas de Wald-Wolfowitz (Wald-Wolfowitz runs)'. Apesar do nome estranho, e outra va- 
riante do teste de Mann-Whitney. Nesse teste, os escores sao transformados em postos 
e ordenados da mesma forma que no teste de Mann-Whitney, mas em vez de analisar os 
postos, esse teste procura "corridas" ou sequencias de um mesmo grupo dentro dos pos¬ 
tos ordenados. Assim, se nao existirem diferengas entre os dois grupos, os postos dos dois 
grupos devem estar aleatoriamente interespagados. Contudo, se os grupos diferem, voce 
deve ver mais postos de um grupo no infcio e mais postos do outro grupo no final. Procu- 
rando por aglomerados de postos, o teste pode determinar se os dois grupos diferem. 
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metodo de Monte Carlo. Isso basicamente en- 
volve criar uma distribu^ao semelhante aque- 
la encontrada na amostra e tomar varias amos- 
tras (o padrao e 10.000) dessa distribu^ao; a 
partir dessas amostras, o valor medio da signi¬ 
ficancia e um intervalo de confianca para esse 
valor podem ser determinados. Se isso nao faz 
sentido algum para voce, nao tenha medo: a 
regra pratica e que quando tiver grandes ta- 
manhos amostrais em geral voce deve optar 
pelo metodo de Monte Carlo; quando tiver 
tamanhos amostrais pequenos (como nesse 
caso), e melhor utilizar o metodo exato (como 
foi feito neste exemplo). Finalmente, clican- 
do em Qpll ° r “ . uma nova caixa de dialogo que 
fornece novas opgoes para a analise e aberta. 
Essas op^oes nao sao muito uteis porque, por 
exemplo, a opgao que fornece as estatfsticas 
descritivas faz isso para todos os dados (nao 
considerando os grupos). Por esse motivo, re- 
comendo obter as estatfsticas descritivas uti- 
lizando os metodos que foram apresentados 
nas Segoes 3.4 e 3.5. Para executar a analise, 
retorne a caixa de dialogo principal e clique 

em I »k . 

13.2.4 Saidas para o teste de Mann- 
Whitney © 

Expliquei na Se$ao 13.2.1 que o teste de 
Mann-Whitney funciona procurando por dife- 
rengas nas poshjoes ordenadas dos escores nos 
diferentes grupos. Portanto, a primeira parte 
da safda resume os dados apos eles terem sido 
ordenados ( ranqueados ). Especificamente, o 
SPSS informa o total e a media dos postos em 
cada cond^ao (veja a Safda 13.2 do SPSS). 


Lembre que o teste de Mann-Whitney se baseia 
nos escores transformados em postos: portanto, 
o grupo com a menor media e o grupo com o 
maior numero de postos baixos. De forma se¬ 
melhante, o grupo com a maior media de postos 
deve ter o maior numero de postos altos. Por¬ 
tanto, essa tabela inicial pode ser utilizada para 
assegurar que grupo tem os maiores postos, o 
que e util no caso de precisarmos interpretar 
um resultado significativo. Voce deve notar que 
a soma dos postos sao as mesmas calculadas na 
Se^ao 13.2.1 (o que e um alfvio para mim!). 

A segunda tabela (Safda 13.2 do SPSS) 
fornece as estatfsticas reais para o teste de 
Mann-Whitney, o procedimento de Wilco- 
xon e o correspondente escore-z (veja a Secao 
13.2.1). A Safda 13.3 do SPSS tem uma colu- 
na para cada variavel (uma para sunbdi e uma 
para wedbdi) e em cada coluna existe um va¬ 
lor da estatistica U de Mann-Whitney, o valor 
da estatistica de Wilcoxon e uma aproximacao 
do valor associado z. Note que os valores de 
U, W s e do escore-z associado sao os mesmos 
que foram calculados na Se^ao 13.2.1! 

A parte importante da tabela e o valor da 
significancia do teste, que fornece a probabili- 
dade bilateral de que a magnitude da estatistica 
teste seja um resultado casual. Esse valor da sig¬ 
nificancia pode ser utilizado quando nenhuma 
previsao tenha sido feita sobre qual grupo ira 
diferir. Contudo, se uma previsao tiver sido feita 
(por exemplo, se dissermos que os usuarios de 
Ecstasy terao mais depressao do que os usuarios 
de Alcool no dia seguinte), precisamos calcular 
a probabilidade unilateral dividindo por dois o 
valor da significancia bilateral. Para esses da- 


Saida 13.2 do SPSS 


Ranks (Postos) 


Type of Drug 
(Tipo de Droga) 

N 

Mean Rank (Media 
dos Postos) 

Sum of Ranks 
(Soma dos Postos) 

Beck Depression Inventory (Sunday) 

Ecstasy (Ecstasy) 

10 

11.95 

119.50 

(Inventario de Depressao de Beck 

Alcohol (Alcool) 

10 

9.05 

90.50 

(Domingo)) 

Total (Total) 

20 



Beck Depression Inventory (Wed- 

Ecstasy (Ecstasy ) 

10 

15.10 

151.00 

nesday) (Inventario de Depressao de 

Alcohol (Alcool) 

10 

5.90 

59.00 

Beck (Quarta-feira)) 

Total (Total) 

20 













482 Andy Field 


dos, o teste de Mann-Whitney nao e significati¬ 
ve) (bilateral) para os escores de depressao cole- 
tados no Domingo. Esse resultado indica que o 
Ecstasy nao e mais depressivo, no dia seguinte, 
do que o Alcool: os dois grupos tem o mesmo 
rn'vel de depressao. Contudo, para as medidas 
do meio da semana, os resultados sao altamen- 
te significativos (p < 0,001). O valor medio dos 
postos indica que o grupo do Ecstasy apresenta 
niveis significativamente mais altos de depres¬ 
sao no meio da semana do que o grupo do Al¬ 
cool. Essa conclusao e obtida observando que 
os escores da quarta-feira apresentam um posto 
medio bem mais alto dos usuarios de Ecstasy 
(15,10) do que dos usuarios de Alcool (5,90). 

A Saida 13.4 do SPSS mostra a saida para o 
teste de Mann-Whitney quando a opgao pela sig¬ 
nificancia exata e selecionada. Inclui isso para 
lhe mostrar que aparecem algumas linhas extras 
que fornecem os valores da significancia exata 
(tanto unilateral quanto bilateral). Esses valores 
nao alteram nossas conclusoes, mas saiba que 
voce deve provavelmente consultar esses valo¬ 
res em vez do valor assintotico, especialmente 
quando os tamanhos amostrais sao pequenos. 


Saida 13.4 do SPSS (Com a significancia 
exata por Monte Carlo) 

Test Statistics 11 (Estatisticas Teste) 



Beck 

Depression 
Inventory 
(Sunday) 
(Inventario de 
Depressao 
de Beck 
(domingo)) 

Beck 

Depression 
Inventory 
(Wednesday) 
(Inventario de 
Depressao 
de Beck 
(quarta-feira)) 

Mann-Whtiney U (U 
de Mann-Whitney) 

35.500 

4.000 

Wilcoxon 1/1/ (W de 
Wilcoxon) 

90.500 

59.000 

z 

-1.105 

-3.484 

Asymp. Sig. (2-tailed) 
(Sig. Assint.) (Bilateral) 

0.269 

0.000 

Exact Sig. [2*(t-tai¬ 
led Sig.) (Sig. Exata) 
[2*(Sig. Unilateral) 

0.280 a 

o.ooo 3 

Exact Sig. (2-taiied.) 
(Sig. Exata) (Bilateral) 

0.288 

0.000 

Exact Sig. (1 -tailed) 

(Sig. Exata) (Unilateral) 

0.144 

0.000 

Point Probability (Pro- 
babilidade Pontual) 

0.013 

0.000 


a Nao corrigido para empates. 
b Variavel de Agrupamento: Tipo de Droga. 


Saida 13.3 do SPSS (Sem a significancia 
exata por Monte Carlo) 

Test Statistics 13 (Estatisticas Teste) 



Beck Depression 
Inventory 
(Sunday) 
(Inventario de 
Depressao de 
Beck (Domingo)) 

Beck Depression 
Inventory 
(Wednesday) 
(Inventario de 
Depressao de 
Beck (Quarta- 
Feira)) 

Mann-Whtiney U (U 
de Mann-Whitney) 

35.500 

4.000 

Wilcoxon W (W de 
Wilcoxon) 

90.500 

59.000 

z 

-1.105 

-3.484 

Asymp. Sig. (2-tai- 
led) (Sig. Assint.) 
(Bilateral) 

0.269 

0.000 

Exact Sig. [2*(1-tai¬ 
led Sig.) (Sig. Exata) 
[2*(Sig. Unilateral) 

0.280 a 

0 . 000 a 


a Nao corrigido para empates. 
b Variavel de Agrupamento: Tipo de Droga. 


13.2.5 Calculando o tamanho de efeito © 

Ja ressaltamos ao longo do texto a impor¬ 
tance de relatar o tamanho de efeito de forma 
que as pessoas tenham uma medida padro- 
nizada do valor que voce observou e, assim, 
eles possam comparar com os seus ou outros 
estudos. O SPSS nao calcula o tamanho de 
efeito, mas podemos calcular tamanhos de 
efeito aproximados facilmente porque o SPSS 
converte a estatistica teste em um escore-z. A 
equa^ao que converte um escore-z em uma es- 
timativa do tamanho de efeito, r, e a seguinte 
(Rosenthal, 1991, p. 19): 

Z 

r ~7W 

Onde z e o escore-z calculado pelo SPSS 
e N e o tamanho dos valores do estudo (isto 
e, o total de observacoes realizadas) na qual 
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Z foi baseado. Nesse caso, a Safda 13.3 do 
SPSS informa que o valor de z e —1,11 para 
os dados de domingo e —3,48 para os dados 
de quarta-feira. Nos dois casos, tivemos 10 
usuarios de Ecstasy e 10 usuarios de Alcool e, 
assim, o numero total de observances e 20. Os 
tamanhos de efeito sao, portanto: 

fDomingo — ^ 

_ —3,48 _ 

^Quarta tt,/o 

Isso representa um pequeno para medio 
efeito para os dados de domingo (isto e, um 
valor abaixo do criterio 0,3 para ser consi- 
derado um efeito medio) e um grande efeito 
para a quarta-feira (o valor esta bem acima do 
limite de 0,5 considerado um grande efeito. 
Muito importante: os dados de domingo mos- 
tram que um tamanho de efeito razoavelmente 
grande pode nao ser significativo quando te- 
mos uma amostra pequena! 

13.2.6 Escrevendo os resultados © 

Para o teste de Mann-Whitney, precisamos 
apenas relatar a estatrstica teste (que e indica- 


da por U) e sua significancia. E claro, tambern 
podemos incluir o tamanho de efeito. Assim, o 
relatorio pode ser semelhante ao seguinte: 

0 Usuarios de Ecstasy (Mediana = 17,50) 
parecem nao diferir quanto ao mvel de de- 
pressao dos usuarios de alcool (Mediana 
= 16,00) no dia seguinte ao uso da droga, 
U = 35,50, ns, 5 = —0,25. Contudo, na 
quarta-feira, os usuarios de Ecstasy (Me¬ 
diana = 33,50) estavam significativamen- 
te mais deprimidos que os usuarios de 
alcool (Mediana = 7,50), U = 4,00. p < 
0,001, r= -0,78. 

Note que relatei a mediana para cada con- 
di^ao - essa estatrstica e mais apropriada que 
a media para testes nao-parametricos. Pode¬ 
mos, ainda, escolher relatar a estatrstica teste 
U de Wilcoxon em vez da de Mann-Whitney e 
isso poderia ser feito da seguinte forma: 

0 Usuarios do Ecstasy (Mediana = 17,50) 
nao parecem diferem nos nfveis de de- 
pressao dos usuarios de Alcool (Mediana 
= 16,00) no dia seguinte ao uso da droga, 
W s = 90,50, ns, r = —0,25. Contudo, na 
quarta-feira, os usuarios de Ecstasy (Me¬ 
diana = 33,50) estavam significativamen- 


( - | 

Dica da Samanta Ferrinho 


■\ 



V. 


• O teste de Mann-Whitney e a soma dos postos de Wilcoxon comparam duas 
condigoes quando diferentes pessoas participam em cada condigao e os da¬ 
dos resultantes nao sao normalmente distribuidos ou violam a hipotese do 
teste t independente. 

• Olhe para a linha denominada Sig. Assint. (bilateral) (Asymp. Sig. (2-tailed))'. 
se o valor for menor do que 0,05, as medias dos dois grupos sao significativa- 
mente diferentes. (Se voce optou por um teste exato, olhe a coluna denomi¬ 
nada Sig. Exata (bilateral) [Exact. Sig. (2-tailed))'. 

• Olhe para o valor dos postos para saber como os grupos diferem (o grupo 
com os escores mais altos apresentara tambern os postos mais altos). 

• O SPSS fornece apenas uma significancia bilateral; se voce quiser a signifi¬ 
cancia unilateral, basta dividir o valor por 2 (se voce optou pelo teste exato, 
olhe para a linha denominada Sig. Exata (unilateral) [Exact. Sig. (1-tailed))'. 

• Relate a estatistica U (ou a W s se preferir), o valor z correspondente e o valor 
da significancia. Relate, ainda, as medianas e suas amplitudes corresponden- 
tes (ou trace um diagrama de caixa e bigodes). 

• Voce deve calcular o tamanho de efeito e relata-lo tambern! 
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Quadro 13.2 


Testes nao-parametricos e poder estatistico © 

Atribuir postos aos dados e uma maneira util de contornar as hipoteses para- 
metricas sobre a forma das distribuigoes, mas ha um prego a pagar: transformando 
os dados em postos, perdemos informagoes sobre a magnitude da diferenga entre 
os valores. 0 resultado e que os testes nao-parametricos podem ser menos pode- 
rosos do que os correspondentes parametricos. Apresentei a nogao de poder esta¬ 
tistico na Segao 1.8.5: ela se refere a habilidade de um teste encontrar um efeito 
que, de fato, exista. Assim, afirmar que os testes nao-parametricos sao menos poderosos significa 
que se existe um efeito genuino nos nossos dados, um teste parametrico tera maior probabilidade 
de detecta-lo do que o correspondente nao-parametrico. Contudo, essa afirmagao e verdadeira so- 
mente se as hipoteses do teste parametrico forem satisfeitas. Desse modo, se utilizarmos um teste 
parametrico e um nao-parametrico nos mesmos dados e esses dados sao normalmente distribui- 
dos, o teste parametrico tera um poder maior de detectar o efeito do que o teste nao-parametrico. 

0 problema e que para definir o poder de um teste, precisamos estar certos de que ele controla 
a taxa de erro do Tipo I (o numero de vezes que um teste encontrara um efeito significativo quando, 
de fato, nao existir tal efeito - veja a Segao 1.8.2). Vimos no Capitulo I que Fisher disse que esse erro 
deveria ser de 5%. Sabemos que quando os dados sao normalmente distribuidos, a taxa de erro do 
Tipo I de um teste baseado nessa distribuigao e 5% e, assim, podemos determinar o poder. Contu¬ 
do, quando os dados nao sao normais, a taxa de erro do Tipo I de um teste baseado na distribuigao 
nao sera de 5% (de fato, nao sabemos qual sera essa taxa, pois ela depende da forma da distribui¬ 
gao); desse modo, nao temos uma maneira de calcular o poder (porque o poder esta relacionado a 
taxa de erro do Tipo I - veja a Segao 1.8.5). Assim, embora voce frequentemente 
leia (na primeira edigao deste livro, por exemplo) que os testes nao-parametricos 
aumentam a probabilidade de erro do Tipo II (isto e, mais chance de aceitar o fato 
de que nao existe uma diferenga entre os grupos, quando ela, de fato, existe), isso 
e verdadeiro apenas se os dados sao normalmente distribuidos. 




te mais deprimidos que os usuarios de Al- 
cool (Mediana = 7,50), W s = 59,00, p < 
0,001, r= -0,78. 

13.3 C0MPARAND0 DUAS CONDigOES 
RELACI0NADAS: 0 TESTE 
DOS POSTOS COM SINAIS DE 
WILCOXON © 

O teste dos postos com sinais de Wilcoxon 
(Wilcoxon, 1945) - nao confunda com o teste 
da soma dos postos da segao anterior - e uti- 
lizado em situagoes em que existem dois con- 
juntos de escores a serem comparados, mas 
esses escores sao provenientes dos mesmos 
participantes. Pense nele como um equivalente 
nao-parametrico ao teste t dependente (ou ao 
teste de Mann-Whitney para dados com medi- 
das repetidas). Imagine que o pesquisador na se¬ 


gao anterior estava interessado na mudanga nos 
niveis de depressao, entre as pessoas, para cada 
uma das duas drogas. Agora queremos compa- 
rar os escores do BDI (Inventario de Depressao 
de Beck) do domingo com os da quarta-feira. 
Ainda temos que utilizar um teste nao-parame¬ 
trico porque as distributes dos escores para as 
duas drogas nao sao normais em um dos dois 
dias (veja a Saida 13.1 do SPSS). 

13.3.1 Teoria do teste dos postos com 
sinais de Wilcoxon © 

O teste dos postos com si- 
Jr~. - nais de Wilcoxon funciona de 
\1 JJ f orma semelhante ao teste t para 

\ “y variaveis dependentes (Capitulo 
7), uma vez que ele tern por 
base as diferengas entre os escores nas duas con- 
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dicfies que estamos comparando. Depois de cal- 
culadas, essas diferengas sao transformadas em 
postos (da mesma forma que em 13.2.1), mas o 
sinal da diferenga (positiva ou negativa) e atri- 
bufdo a cada posto. Se utilizarmos os mesmos 
dados de antes, podemos comparar os escores 
de depressao do domingo com os de quarta-feira 
para as duas drogas separadamente. 

A Tabela 13.2 mostra os postos para es¬ 
ses dados. Lembre que estamos determinando 
os postos das duas drogas em separado. Pri- 
meiro, calcule as diferengas entre domingo e 
quarta-feira (isto e, apenas subtraia os valores 
de domingo dos de quarta-feira). Se a diferen- 
5 a e zero (isto e, os valores dos dois dias sao 
iguais), exclua esses dados da analise. Anota- 


mos o sinal das diferengas (isto e, quais esco¬ 
res sao positivos ou negativos) e ordenamos as 
diferengas (comegando com a menor) igno- 
rando se ela e positiva ou negativa. E a mesma 
maneira da Segao 13.2.1 e lidamos com esco¬ 
res empatados do mesmo modo. Finalmente, 
juntamos todas as diferengas que apresenta- 
ram o mesmo sinal e as somamos. A soma das 
diferengas positivas e representada por T + e as 
negativas, por T. Assim, para o Ecstasy, T + = 
36 e T_ = 0 (nao tivemos escores negativos), e 
para o Alcool, T + = 8 e T— = 47. A estatistica 
teste, T, e a menor dos dois valores, e e 0 para 
a Ecstasy e 8 para o Alcool. 

Para calcular a significancia da estatisti¬ 
ca teste (T), novamente olhamos para a media 


Tabela 13.2 Postos no testes dos postos com sinais de Wilcoxon 
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( T ) e para o erro padrao (EP T ), que, da mesma 
forma que no teste da soma dos postos e o de 
Mann-Whitney na segao anterior, sao fungoes 
do tamanho da amostra, n (porque utilizamos 
os mesmos participantes, existe apenas um ta¬ 
manho amostral): 


- _ n(n +1) 

4 


EP t = 


n(n + l)(2n + l) 


24 


^Quarta — 


T-T 

EP t 


8-27,5 

9,81 


-1,99 


Se esses valores sao maio- 
res do 1,96 (ignorando o sinal), 
eles sao significativos no nivel 
p < 0,05. Assim, o teste mostra 
que existem diferengas signifi- 
cativas entre os escores de depressao das 
Quartas-Feiras e dos Domingos para as duas 
drogas (Ecstasy e Alcool). 



Nos dois grupos, n e simplesmente 10 
(porque esse e o numero de participantes que 
foi utilizado). Contudo, lembre que para o gru- 
po do Ecstasy, duas pessoas foram excluidas 
por apresentarem uma diferenga igual a zero; 
portanto, o tamanho da amostra a ser utilizado 
e 8 e nao 10. Assim, temos: 


^Ecstasy — 


M±!> = 18 

4 


EP 


^Ecstasy 


8(8 + 1) (16 + 1) 


24 


7,14 


Nao houve exclusoes para o grupo Alcool, 
assim, temos: 

- _ 10(10 + 1 ) 

1 Alcool —---— Z /,3U 


^rAicooi 


10(10 + 1)(20 + 1 ) 


24 


= 9,81 


Como antes, se soubermos o valor da es- 
tatfstica teste, a sua media e o erro padrao, po- 
demos facilmente converte-la em um escore-z 
utilizando a equagao que foi vista no Capitulo 
1 e na segao anterior: 

_X-X _T-T 
s EP t 

Se calcularmos esses valores para os es¬ 
cores do Ecstasy e do Alcool, obteremos: 

_T — T _ 0—18 _ 

Z Ecstasy — — — Z,jZ 


13.3.2 Executando a analise ® 

Para realizar a mesma analise com o 
SPSS, podemos utilizar os mesmos dados que 
foram utilizados antes, mas como queremos 
verificar as alteragoes de cada droga separada- 
mente, precisamos utilizar o comando split file 
(dividir arquivo) e solicitar que o SPSS divida 
o arquivo pelo tipo de droga [drug]. Esse pro- 
cesso assegura que qualquer analise posterior 
sera feita nos grupos do Ecstasy e do Alcool 
separadamente. Uma vez que o arquivo tenha 
sido dividido, selecione a caixa de dialogo 
para o teste de Wilcoxon utilizando o menu 
Analyze=>Nonparametric Tests=>2 Related 
Samples... (Analisar=>Testes Nao-parametri- 
cos=>Duas Amostras Relacionadas...) (veja a 
Figura 13.4). Essa caixa de dialogo permite 
que voce selecione, tambem, outros testes 
(veja o Quadro 13.3). 

Com essa caixa de dialogo ativada, se¬ 
lecione as duas variaveis da lista (clique na 
primeira variavel com o mouse e depois na 
segunda). A primeira variavel que voce sele- 
cionar (Inventario de Depressao de Beck Do¬ 
mingo [sunbdi]) sera denominada Variable 
1 (Variavel 1) no quadro Current Selections 
(Selegoes atuais) e a segunda variavel que 
voce selecionar (Inventario de Depressao de 
Beck Quarta-Feira [wedbdi]) aparecera como 
Variable 2 (Variavel 2). Quando voce tiver se- 
lecionado as variaveis, transfira as duas para 
o quadro Test Pair(s) List (Lista de Pares do 
Teste) clicando em _d. Se voce quiser execu- 
tar varios testes de Wilcoxon, pode selecionar 
outro par de variaveis e transferi-lo para a lis- 
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Two Related Samples Tests 
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Figura 13.4 Caixas de dialogo para o teste dos postos com sinais de Wilcoxon. 


Quadro 13.3 


Outras opcoes para o teste dos postos com sinais de Wilcoxon © 

Na caixa de dialogo principal existem outros testes que podem ser selecionados: 

• Sign (Sinai). Esse teste basicamente faz o mesmo que o teste dos postos com sinal de 
Wilcoxon, exceto que ele e baseado na diregao das diferengas (positiva ou negativa). A 
magnitude da mudanga e completamente ignorada (diferente do teste de Wilcoxon onde 
os postos nos dao informagoes sobre a magnitude das mudangas). Por esses motivos, o 
teste dos sinais tern baixo poder (ele nao e bom para detectar efeitos), a menos que os 
tamanhos amostrais sejam pequenos (seis ou menos). Assim, francamente, nao vejo por 
que utiliza-lo! 

• McNemar: Esse teste e util quando tivermos dados nominais em vez de ordinais. Ele e 
tipicamente utilizado quando estamos procurando por mudangas nos escores de pessoas 
e ele compara a quantidade de pessoas que alteraram suas respostas em uma diregao 
(isto e, os valores aumentaram) com aqueles que mudaram na diregao oposta (os valores 
diminuiram). Assim, esse teste precisa ser utilizado quando voce tiver duas variaveis di- 
cotomicas relacionadas. 

• Marginal Homogeneity (Homogeneidade Marginal): Esse procedimento e uma extensao 
do teste de McNemar, mas para variaveis ordinais. Ele faz praticamente o mesmo que o 
teste de Wilcoxon. 
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ta de variaveis e depois selecionar outro par e 
assim por diante. Nesse caso, queremos testar 
apenas um par de variaveis. Se voce clicar em 
I Exacl I (Exato), outra caixa de dialogo apare- 
ce e permite que a significancia exata seja cal- 
culada (veja a Segao 13.2.3). Nao vou retomar 
esse assunto novamente, mas devo dizer que 
quando os tamanhos amostrais sao grandes 
deve-se optar pelo metodo de Monte Carlo, e 
quando tivermos pequenos tamanhos amos¬ 
trais, e melhor optar pelo calculo exato. Nao 
optei por nenhum deles nesse exemplo. Se 
voce clicar em l; 1 (Opgbes), uma caixa de 
dialogo aparece tornando posslvel selecionar 
estatlsticas descritivas. Diferentemente do tes¬ 
te de Mann-Whitney, as estatlsticas descritivas 
valem a pena, porque elas sao uma mudanga 
relevante entre variaveis (colunas do editor de 
dados). Para realizar a analise, retorne a caixa 
de dialogo principal e clique em <* . 

13.3.3 Saidas para o Grupo do Ecstasy ® 

Se voce dividiu o ar- 
quivo, o primeiro conjun- 
to de resultados obtido 
sera para o grupo do Ecs¬ 
tasy (Saida 13.5 do 
SPSS). A primeira tabela 
fornece informagoes so- 
bre os postos dos escores. 
Ela nos informa o numero de postos negativos 
(aquelas pessoas para as quais o escore de do- 
mingo foi maior do que o de quarta-feira) e o 
numero de escores positivos (pessoas para as 
quais os escores da quarta-feira foram maiores 
do que os de domingo). A Tabela mostra que 8 
dos 10 participantes apresentaram escores na 
quarta-feira maiores do que os de domingo, 
indicando uma grande depressao no meio da 
semana quando comparada com a manha se- 
guinte. Foram encontrados dois postos empa- 
tados (isto e, participantes com os mesmos 
valores nos dois dias). A tabela mostra tam- 
bem o numero medio de postos positivos e ne¬ 
gativos, bem como a soma desses postos. 
Abaixo da tabela aparecem notas informando 
a que os postos positivos e negativos estao se 


Saida 13.5 do SPSS 


Ranks d (Postos) 





Mean 

Sum of 




Rank 

Ranks 




(Media 

(Soma 




dos 

dos 



N 

postos) 

postos) 

Beck Depres- 

Negative 

0 a 

0.00 

0.00 

sion Inventory 

Ranks (Pos- 




(Wednesday) 

tos Negati- 




(Inventario 
de Depres¬ 
sao de Beck 

vos) 




(Quarta-feira)) - 
Beck Depres- 

Positive 

8 b 

4.50 

36.00 

sion Inventory 

Ranks 




(Sunday) (Inven- 

(Postos Posi- 




tario de Depres- 

tivos) 




sao de Beck 

Ties (Empa- 

2 c 



(Domingo)) 

tes) 

Total (total) 

10 




a Inventario de Depressao de Beck (Quarta) Inventario de 
Depressao de Beck (Domingo), 
b Inventario de Depressao de Beck (Quarta) Inventario de 
Depressao de Beck (Domingo), 
c Inventario de Depressao de Beck (Quarta) Inventario de 
Depressao de Beck (Domingo), 
d Tipo de Droga = Ecstasy. 


Test Statistics b,c (Estatlsticas Teste) 



Beck Depression Inventory 
(Wednesday) (Inventario de 
Depressao de Beck (Domingo)) 

- Beck Depression Inventory 
(Sunday) (Inventario de Depressao 
de Beck (Quarta-feira)) 

z 

Asymp. Sig. (2-tai- 
led) (Sig. Assint.) 
(Bilateral) 

-2.527 a 

0.012 


a Com base em postos negativos. 
b Teste dos Postos com Sinai de Wilcoxon. 
c Tipo de Droga = Ecstasy. 


referindo (fornecendo assim o mesmo tipo de 
explicagao que acabei de fornecer! - viu, eu 
nao sou esperto, apenas li as notas da tabela!). 
Na Segao 13.3.1, expliquei que a estatlstica 
teste, T, e o menor valor dos dois tipos de pos¬ 
tos, assim, o nosso valor de teste aqui e a soma 
dos postos negativos (isto e, zero). Tambem 
mostrei como esse valor pode ser convertido 
em um escore-z e isso e o que o SPSS faz. A 
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vantagem dessa abordagem e que ela permite 
que o valor exato da significancia seja calcula- 
do com base na distribuicao normal. A segun- 
da Tabela da Saida 13.5 do SPSS mostra que a 
estatistica teste esta baseada nos postos nega¬ 
tives, que o escore-z e —2,53 (o valor calcula- 
do na Seciio 13.3.1) e que esse valor e signifi¬ 
cative ap = 0,012. Assim, em virtude desse 
valor ser baseado nos postos negativos (e por- 
que a estatistica teste e o menor valor entre os 
postos positivos e negativos, a maioria dos 
postos deve ser positiva), podemos concluir 
que tomar Ecstasy aumenta significativamente 
a depressao (medida pelo Inventario de De¬ 
pressao de Beck (BDI)) da manha seguinte ao 
meio da semana. Se a estatistica teste tivesse 
sido baseada nos postos positivos, isso nos in- 
formaria que os resultados seriam opostos 
(isto e, os escores do BDI seriam maiores na 
manha seguinte ao uso do que no meio da se¬ 
mana). Assim, podemos concluir que para os 
usuarios de Ecstasy existe um aumento signi¬ 
ficative da depressao a partir do dia seguinte 
para o meio da semana (z = —2,53. p < 0,05). 

13.3.4 Saidas para o Grupo do Alcool ® 

O restante da safda deve conter as mes- 
mas duas tabelas anteriores, mas agora para o 
grupo do Alcool (se isso nao aconteceu, voce 
provavelmente esqueceu de dividir o arquivo). 
Como antes, a primeira tabela na Safda 13.6 
do SPSS fornece informacoes sobre os postos 
dos escores. Ela nos informa sobre o numero 
de postos negativos (aqueles em que as pes- 
soas tiveram mais depressao no domingo do 
que na quarta-feira) e o numero de postos po¬ 
sitivos (pessoas que tiveram mais depressao 
na quarta-feira). A tabela mostra que para 9 
dos 10 participantes, seus escores no domingo 
foram maiores do que na quarta-feira, indi- 
cando um grau de depressao maior na manha 
seguinte comparado com o meio da semana. 
Diferentemente dos usuarios do Ecstasy, nao 
houve postos empatados nesse caso. A tabela 
mostra, ainda, o numero medio de postos po¬ 
sitivos e negativos, bem como a soma deles. 
Abaixo da tabela existem notas informando 
com o que os postos positivos e negativos 


Saida 13.6 do SPSS 


Ranks d (Postos) 



N 

Mean 

Rank 

(Media 

dos 

Postos 

Sum of 
Ranks 
(Soma 
dos 
Postos) 

Beck Depres- 

Negative 

9 a 

5.22 

47.00 

sion Inventory 

Ranks (Pos- 




(Wednesday) 

tos Negati- 




(Inventario de 

vos) 




Depressao de 

Positive 

1 b 

8.00 

8.00 

Beck (Quarta 

Ranks (Pos- 




Feira)) - 

tos Positivos) 




Beck Depres- 

Ties (Empa- 

0 C 



sion Inventory 

tes) 




(Sunday) 

Total (total) 

10 



(Inventario de 





Depressao de 





Beck (Domin- 





go)) 






a Beck Depression Inventory (Wednesday) (Inventario de 
Depressao de Beck (Quarta)) < Beck Depression Inventory 
(Sunday) (Inventario de Depressao de Beck (Domingo)) 
b Beck Depression Inventory (Wednesday) (Inventario de 
Depressao de Beck (Quarta)) > Beck Depression Inventory 
(Sunday) (Inventario de Depressao de Beck (Domingo)) 
c a Beck Depression Inventory (Wednesday) (Inventario de 
Depressao de Beck (Quarta)) = Beck Depression Inventory 
(Sunday) (Inventario de Depressao de Beck (Domingo)) 
d Type of Drug = Alcohol (Tipo de Droga = Alcool) 


Test Statistics b,c (Estatisticas Teste) 



Beck Depression inventory 
(Wednesday) (Inventario de 
Depressao de Beck (Quarta-Feira)) 

- Beck Depression inventory 
(Sunday) (Inventario de 
Depressao de Beck (Domingo)) 

Z 

Asymp. Sig. 
(2-taiied) (Sig. As- 
sint.) (Bilateral) 

-1.990“ 

0.047 


a Based on negative ranks (Com base em postos negativos) 
b Wilcoxon Signed Rank Test (Teste dos Postos com Sinai 
de Wilcoxon) 

c Type of Drug = Alcohol (Tipo de Droga = Alcohol) 


estao relacionados. Como antes, o menor 
valor dos dois grupos de postos e convertido 
no escore-z (nesse caso, o valor 8). A segun- 
da tabela informa que a estatistica teste tern 
como base os postos positivos e que o escore-z 
e —1,99 (esse e o valor calculado em 13.3.1 - 
viu, meus calculos manuais funcionam!) e que 
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esse valor e significativo no m'vel p < 0,047. 
Portanto, concluimos (baseados no fato que 
postos positivos foram utilizados) que quando 
alguem toma Alcool, existe um declmio sig¬ 
nificativo do mvel de depressao (mensurada 
pelo BD1) da manha seguinte para o meio da 
semana (z= — 1,99, p < 0,05). 

A partir dos resultados dos dois grupos po- 
demos ver que existe um efeito oposto quando 
o Alcool e ingerido do que quando o Ecstasy e 
tornado. O Alcool torna voce levemente depri- 
mido na manha seguinte, mas essa depressao 
some no meio da semana. O Ecstasy tambem 
causa depressao na manha seguinte ao con- 
sumo, mas essa depressao aumenta no meio 
da semana. E claro, para se ver o verdadeiro 
efeito na manha seguinte terfamos que ter me- 
dido a depressao antes de a droga ser ingerida! 
Esse efeito oposto entre grupos de pessoas e 
conhecido como uma interagao (isto e, voce 
obtem um efeito sob certas circunstancias e 
um efeito diferente sob outras circunstancias) 
- vimos isso nos Capitulos 10, 11 e 12. 

13.3.5 Calculando o tamanho de 
efeito © 

O tamanho de efeito pode ser calculado 
da mesma forma que para o teste de Mann- 
Whitney (veja a Equagao na Segao 13.2.5). 
Nesse caso, a Saida 13.6 do SPSS nos informa 
que para o grupo do Ecstasy, z e —2,53, e que 
para o grupo do Alcool, z e —1,99. Nos dois 
casos temos 20 observagoes (mas utilizamos 
apenas 10 pessoas e as testamos duas vezes; 
o niimero de observagoes, e nao o numero de 
pessoas, e importante aqui). O tamanho de 
efeito e, desta forma; 

_-2,53_ ns 7 
r Ecstasy - ^ - 0,57 

-1,99 

rAfcool = 720“ = ~ 0,44 

Isso representa uma grande mudanga nos 
niveis de depressao quando o Ecstasy e uti- 
lizado (o valor esta acima do limite de 0,50 
proposto por Cohen) e um efeito medio para 


grande na depressao quando Alcool e ingerido 
(o valor obtido esta entre os niveis de 0,3 e 0,5 
para um efeito medio para grande proposto 
por Cohen). 

13.3.6 Escrevendo e interpretando os 
resultados © 

Para o teste de Wilcoxon precisamos rela- 
tar apenas a estatistica teste (que e representa- 
dapelaletra Tee amenor das duas somas dos 
postos), a sua significance e de preference o 
tamanho de efeito. Assim, o relatorio pode ser 
assim: 

/ Para os usuarios do Ecstasy, os niveis de 
depressao foram significativamente mais 
altos na quarta-feira (Mediana = 33,50) 
do que no domingo (Mediana = 17,50), T 
= 0, p < 0,05, r = —0,57. Contudo, para os 
usuarios de Alcool, o oposto e verdadeiro: 
os niveis de depressao foram significativa¬ 
mente menores na quarta-feira (Mediana 
= 7,50) do que no domingo (Mediana = 
16,0), T= 8, p < 0,05, r = -0,44. 

Podemos tambem apresentar os valores 
de z: 

/ Para os usuarios do Ecstasy, os niveis de 
depressao foram significativamente mais 
altos na quarta-feira (Mediana = 33,50) 
do que no domingo (Mediana = 17,50), 
z = —2,53, p < 0,05, r = —0,57. Contu¬ 
do, para os usuarios de Alcool o oposto e 
verdadeiro: os niveis de depressao foram 
significativamente menores na quarta-fei¬ 
ra (Mediana = 7,50) do que no domingo 
(Mediana = 16,0), z = —1,99, p < 0,05, r 
= -0,44. 

13.4 DIFERENQAS ENTRE VARI0S 
GRUPOSINDEPENDENTES: 0 
TESTE DE KRUSKAL-WALLIS © 

No Capitulo 8, descobrimos uma tecnica 
denominada ANOVA independente de um fa- 
tor que pode ser utilizada para testar diferengas 
entre varios grupos independentes. Mencionei 
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• 0 teste dos postos com sinais de Wilcoxon compara duas condigoes quando 
as mesmas pessoas participam em cada condigao e os dados resultantes nao 
sao normalmente distribuidos ou violam a hipotese do teste t dependente. 

• Observe a linha denominada Sig. Assint. (bilateral) (Asymp. Sig. (2-tailed))\ se o 
valor for menor do que 0,05, os dois grupos sao significativamente diferentes. 

• Observe os postos positivos e negativos (e as notas da tabela explicando o que 
eles significam) para saber como os grupos diferem (um grande numero de pos¬ 
tos em uma diregao em particular nos informa qual a diregao do resultado). 

• Como ja aconteceu com outros testes, o SPSS fornece apenas o valor da sig¬ 
nificancia bilateral; se voce quer a significancia unilateral, basta dividir o valor 
da bilateral por 2. 

• Relate a estatistica T, o valor z correspondente e o valor da significancia e o 
tamanho de efeito, se posslvel. Relate, ainda, as medianas e suas amplitudes 
correspondentes (ou trace um diagrama de caixa e bigodes). 

_ 


varias vezes naquele capftulo que a ANOVA e 
uma tecnica robusta a violagao de suas hipo- 
teses. Vimos tambem que podem ser tomadas 
algumas medidas quando existir heterogenei- 
dade das variancias (Quadro 8.3). Entretanto, 
existe alternativa: a ANOVA independente de 
um fator tem uma contraparte nao-parametri- 
ca chamada teste de Kruskal-Wallis (Kruskal 
e Wallis, 1952; Figura 13.5). Se voce tem da¬ 
dos nao normalmente distribuidos, ou violou 
alguma outra suposigao, esse teste pode ser 
util para contornar o problema. 



Figura 13.5 Joseph Kruskal encontrando al- 
guns erros na primeira edigao de Descobrindo 
a estatistica utiiizando o SPSS. 


Li uma historia recentemente em um jor- 
nal aftrmando que cientistas tinham descober- 
to que a substancia “genistein”, que ocorre 
naturalmente na soja, estava relacionada com 
uma contagem baixa de espermatozoides em 
machos ocidentais. Quando voce le a pesquisa 
real, sabe que na verdade ela foi realizada em 
ratos e nao apresenta relagao com uma baixa 
contagem de espermatozoides, mas existe uma 
evidencia de um desenvolvimento sexual anor- 
mal nos ratos machos (provavelmente porque 
essa substancia qulmica age como estrogenio). 
O jornalista interpretou isso como uma relagao 
com o declfnio na contagem de espermatozoi¬ 
des em homens ocidentais (que jornalista!). 
De qualquer forma, como um vegetariano que 
come muitos produtos de soja e que provavel¬ 
mente vai querer ter filhos um dia, quero testar 
essa ideia em humanos em vez de ratos. Peguei 
80 homens e os dividi em quatro grupos que 
variavam no numero de refeigoes com soja que 
eles comiam por semana em um perfodo de 
um ano. O primeiro grupo era o controle e eles 
nao tinham soja nas refeigoes (nada no ano 
inteiro); o segundo grupo tinha uma refeigao 
com soja por semana (cerca de 52 refeigoes no 
ano); o terceiro grupo tinha quatro refeigoes 
por semana (aproximadamente 208 no ano); e 
o ultimo grupo tinha sete refeigoes com soja 
por semana (ou 364 durante o ano). No final 
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do ano, todos os participantes foram testados 
(isto e, foram enviados a um laboratorio tao 
longe quanto possfvel de mim). 3 


13.4.1 Teoria do teste de Kruskal-Wallis © 

A teoria do teste de 
Kruskal-Wallis e parecida 
com a do teste de Mann-Whit¬ 
ney (e da soma dos postos de 
Wilcoxon), assim, antes de 
continuar a leitura de uma olhada na Segao 
13.2.1. Da mesma forma que o teste de Mann- 
-Whitney, o teste de Kruskal-Wallis tem como 



3 No caso de qualquer medico estar lendo isso, esses dados 
foram inventados e eu nao tenho absolutamente ideia al- 
guma do que seja uma verdadeira contagem de esperma- 
tozoides; assim os valores provavelmente sao ridiculos, 
pego desculpas e voce pode rir da minha ignorancia! 


base os postos dos valores. Para comegar, 
simplesmente ordene os escores do menor 
para o maior, ignorando o grupo ao qual o es- 
core pertence, e atribua ao menor o posto 1, 
ao proximo o posto 2 e assim por diante (veja 
a Se^ao 13.2.1 para mais detalhes). Quando 
voce tiver atribuido postos a todos os dados 
coletados, retorne com os escores aos seus 
grupos e simplesmente adicione os postos de 
cada grupo. A soma dos postos de cada grupo 
e representada por R, (onde i e utilizado para 
representar um grupo em particular). A Tabe- 
la 13.3 mostra os dados brutos para esse 
exemplo mais os postos (tente determinar os 
postos dos dados e veja se voce obtem os 
mesmos resultados que eu!). 

Depois que a soma dos postos foi calcula- 
da para cada grupo, a estatfstica teste H e cal- 
culada utilizando uma equagao como a (13.1): 


Tabela 13.3 Dados para o exemplo da soja com postos 


Sem soja 


Com uma refeigao 

Com 4 refeicoes 

Com 7 refeicoes 

Espermatozoides 

(Milhoes) 

Posto 

Espermatozoides 

(Milhoes) 

Posto 

Espermatozoides 

(Milhoes) 

Posto 

Espermatozoides 

(Milhoes) 

Posto 

0,35 

4 

0,33 

3 

0,40 

6 

0,31 

1 

0,58 

9 

0,36 

5 

0,60 

10 

0,32 

2 

0,88 

17 

0,63 

11 

0,96 

19 

0,56 

7 

0,92 

18 

0,64 

12 

1,20 

21 

0,57 

8 

1,22 

22 

0,77 

14 

1,31 

24 

0,71 

13 

1,51 

30 

1,53 

32 

1,35 

27 

0,81 

15 

1,52 

31 

1,62 

34 

1,68 

35 

0,87 

16 

1,57 

33 

1,71 

36 

1,83 

37 

1,18 

20 

2,43 

41 

1,94 

38 

2,10 

40 

1,25 

23 

2,79 

46 

2,48 

42 

2,93 

48 

1,33 

25 

3,40 

55 

2,71 

44 

2,96 

49 

1,34 

26 

4,52 

59 

4,12 

57 

3,00 

50 

1,49 

28 

4,72 

60 

5,65 

61 

3,09 

52 

1,50 

29 

6,90 

65 

6,76 

64 

3,36 

54 

2,09 

39 

7,58 

68 

7,08 

66 

4,34 

58 

2,70 

43 

7,78 

69 

7,26 

67 

5,81 

62 

2,75 

45 

9,62 

72 

7,92 

70 

5,94 

63 

2,83 

47 

10,05 

73 

8,04 

71 

10,16 

74 

3,07 

51 

10,32 

75 

12,10 

77 

10,98 

76 

3,28 

53 

21,08 

80 

18,47 

79 

18,21 

78 

4,11 

56 

Total(FU 

927 


883 


883 


547 
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H 


12 


k . Rf 


N(N + 1)~^ n 


Y~ -30V + 1) (13.1) 



Nessa equagao, R; e a 
soma dos postos para cada 
grupo, N 6 o total da amostra 
(nesse caso, 80) e n, e o tama- 
nho amostral de cada um dos 
grupos (nesse caso, temos todos os valores 
iguais a 20). Eleve a soma dos postos de cada 
grupo ao quadrado e divida esse valor pelo ta- 
manho amostral de cada grupo. Depois, adi- 
cione esses valores. Isso resolve a parte cen¬ 
tral da equagao; o resto dela envolve o calculo 
de varios valores baseados no tamanho total 
da amostra. Para esses dados, temos: 


„ 12 / 927 2 883 2 883 2 547 2 \ 

H —-I-1-1-1-1 

80(81) V 20 20 20 20 / 

-3(81) 

= —*2=—(42966,45 + 38984,45 + 38984,45 
6480 

+ 14960,45)-243 
= 0,0019 (135895,8)-243 
= 251,66-243 
= 8,659 

Essa estatistica teste tem um tipo especial 
de distribuicao conhecida como qui-quadrado 
(veja o Capitulo 16), e para essa distribuicao 
existe um parametro denominado grau de li- 
berdade, que e o mimero de grupos menos um 
(k - 1); nesse caso, 3. 


13.4.2 Atribuindo dados e fazendo 
analise condicional © 

Quando os dados sao coletados com dife- 
rentes participantes em cada grupo, precisamos 
inseri-los utilizando uma variavel de codigo ou 
codificadora. Assim, o editor de dados tera duas 
colunas de dados. A primeira sera a da variavel 
de codigo (denominada aqui de Soya) que, nes¬ 
se caso, tera quatro valores (por conveniencia, 
sugiro 1 = sem soja, 2 = uma refeigao com soja 
por semana, 3 = quatro refeigoes com soja se- 


manais e 4 = sete refeigoes com soja semanais). 
A segunda coluna tera os valores da variavel 
dependente (contagem de espermatozoides) 
mensurada no final do ano (chame essa variavel 
de sperm). Quando voce entrar com os dados 
no SPSS lembre de informar ao computador os 
codigos dos grupos que estao sendo utilizados 
(veja a Segao 2.4.4). Esses dados podem ser en- 
contrados no arquivo Soya.sav. 

Primeiro, rodamos algumas analises ex- 
ploratorias nos dados; porque queremos ve- 
rificar diferengas precisamos realizar essas 
analises exploratorias para cada grupo (Se- 
goes 3.5 e 3.6). Se voce realizar essas anali¬ 
ses devera, entao, encontrar algumas tabelas 
semelhantes as mostradas na Saida 13.7 do 
SPSS. A primeira tabela mostra que o teste 
K-S (veja a Segao 3.5) nao foi significativo 
para o grupo-controle (D(20) = 0,181, p > 
0,05), mas o teste de Shapiro-Wilk e signi¬ 
ficativo, e esse teste e, de fato, mais preciso 
(embora ele seja menos relatado) que o teste 
K-S (veja o Capitulo 3). Os dados do grupo 
que tiveram uma refeigao de soja por semana 
foram significativamente diferentes da normal 
(D(20) = 0,207, p < 0,05), assim como os 
para quern teve quatro refeigoes semanais com 
soja (D(20) = 0,267, p < 0,01) e sete (D(20) 
= 0,204, p < 0,05). A segunda tabela mostra 
os resultados do teste de Levene. A hipotese 
de homogeneidade da variancia foi violada, 
F(3, 76) = 5,12, p < 0,01) e isso e mostrado 
pelo fato de a significancia do teste de Leve¬ 
ne ser menor do que 0,05. Desse modo, esses 
dados violam duas hipoteses importantes: eles 
nao sao normalmente distribufdos e os grupos 
apresentam variancias heterogeneas! 

13.4.3 Executando o teste de Kruskal- 
Wallis no SPSS © 

Primeiro, acesse a caixa de dialogo principal 
utilizando o menu Analyze=>Nonparametric 
Tests=»K Independent Samples... (Anali- 
sar=>Testes nao-parametricos=>K Amostras In- 
dependentes...) (veja a Figura 13.6). Com essa 
caixa de dialogos ativada, selecione a variavel 
dependente da lista (clique em Sperm Count 
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Saida 13.7 do SPSS 

Tests of Normality (Testes de Normalidade) 



Number of Soya Meals Per 

Week (Numero de refeigoes 

Kolmogorov-Smirnov 1 

Shapiro-Wi/k 


Statistic 

df 

Sig. 

Statistic 

df 

Sig. 


com soja por semana) 

(Estatistica) 

(gi) 

(Sig.) 

(Estatistica) 

(gi) 

(Sig.) 

Sperm 

No Soya Meals (Sem refeigoes com soja) 

0.181 

20 

0.085 

0.805 

20 

0.001 

Count 

1 Soya Meal per Week (1 refeipao com 

0.207 

20 

0.024 

0.826 

20 

0.002 

(Millions) 

soja por semana) 







(Contagem 

4 Soya Meal per Week (4 refeigoes com 

0.267 

20 

0.001 

0.743 

20 

0.000 

de esper- 

soja por semana) 







matozoides 

7 Soya Meal per Week (7 refeigoes com 

0.204 

20 

0.028 

0.912 

20 

0.071 

(Milhoes)) 

soja por semana) 








a Correpao da significancia de Lilliefors. 


Test of Homogeneity of Variance (Teste de Homogeneidade das Variancias) 



Levene Statistic 
(Estatistica de Levene) 

dfl 

(gii) 

df2 

(gi2) 

Sig. 

(Sig.) 

Sperm Count Based on Mean (Com base na Media) 

5.117 

3 

76 

0.003 

(Millions) Based on Median (Com base na mediana) 

2.860 

3 

76 

0.042 

(Contagem de Based on Median and with adjusted df 

espermatozoides (Com base na mediana e com g1 ajustado) 

2.860 

3 

58.107 

0.045 

(Milhoes)) Based on on trimmed mean (Com base na 

media interna) 

4.070 

3 

76 

0.010 


Tests for Several Independent Samples 


Ted Type 

9 UuM W*H 

9 Jcrtckheem-Tarpstra 


Several Independent Samples: Opti... [X 


-1 

Statutes 

Cortnje | 

W Dcscnptrve 1” Quartles 

Cancel 

Mw>g V»ue« 

** 1 

(• Exclude cases teat-by teat 

C Exdude cases kstwise 





Several Independent Samples: Define ... 



Range for Groupng Variable 
Mnmjn: D 

Maonxm [4” 


Conbnue 


Cancel 


Help 


C Aeymptote only 
G Monte Carte 

Corf donee level: 

Nirfcer of samples 110000 
C Exact 


Cortnue 


(99 X 


Cancel 


H<* 


Exact method be used rat ©ad of Monte Carlo 

when computational kmts alow 


Figura 13.6 Caixas de dialogo para o teste de Kruskal-Wallis. 
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(Milions) (Contagem de Espermatozoides (Mi- 
lh5es)) e transfira-a para o quadro Test Varible 
List (Lista de Variaveis de Teste) clicando em 
_lI. A seguir, selecione a variavel independen- 
te (a variavel de grupo), nesse caso, Soya, e 
transfira-a para o quadro Grouping Variable 
(Variavel de Agrupamento). Quando a variavel 
de agrupamento tiver sido selecionada, o bo- 
tao I 0 '" 1 ~ (Definir Amplitude) se torna ativo e 
voce deve clica-lo para ativar a caixa de dialogo 
Define Range (definir intervalo). O SPSS pre- 
cisa saber a faixa de valores que voce atribuiu 
aos grupos e existe um espago para digitar os 
valores minirno e maximo. Se voce seguiu os 
codigos sugeridos, o valor mfnimo deve ser 1 
e o maximo 4, assim, digite esses numeros nos 
espagos apropriados. Quando tiver definido os 
grupos, clique em (Continuar) para retor- 
nar a caixa de dialogo principal. A caixa de dia¬ 
logo principal tambem fornece Qp,:i "‘ ■ (OpgSes) 
para realizar outros testes semelhantes ao de 
Kruskal-Wallis (veja o Quadro 13.4). 

Se voce clicar em Elaci I (Exato...), ira 
obter uma caixa de dialogo para selecionar 
o valor da significancia exato para o teste de 
Kruskal-Wallis. Expliquei essa opgao na Se- 
gao 13.2.3, portanto, nao vou me repetir aqui. 
Vou apenas recapitular afirmando que quando 
os tamanhos amostrais sao grandes, provavel- 
mente voce deve optar pelo metodo de Monte 
Carlo (como foi feito nesse exemplo), e quan¬ 
do tivermos pequenos tamanhos amostrais, a 


opgao deve ser pelo teste exato. Finalmente, 
se voce clicar em Qp ‘°" t (Opgoes), uma cai¬ 
xa de dialogo fornece opgSes adicionais de 
analise. Essas opgoes nao sao muito uteis; 
por exemplo, a opgao que fornece as estatfs- 
ticas descritivas faz isso para todo o conjunto 
de dados (nao dividindo os valores de acordo 
com o grupo a que eles pertencem). Por essa 
razao, recomendo obter as estatfsticas des¬ 
critivas utilizando o metodo que aprendemos 
nas Segoes 3.4 e 3.5. Para rodar a analise, 
retorne a caixa de dialogo principal e clique 
em <* . A opgao final e realizar o teste de 
tendencia de Jonckheere-Terpstra (selecione 
p Jonckheere-Terpstra ). Isso sera util se quisermos 
verificar se a media dos grupos apresenta uma 
tendencia linear (veja a Segao 8.2.10.5). 

13.4.4 Saidas para o teste de Kruskal- 
-Wallis ® 

A Saida 13.8 do SPSS mostra um resumo 
dos postos dos dados para cada condigao, e pre- 
cisamos disso para interpretar qualquer efeito. 

A Saida 13.9 do SPSS mostra a estatistica 
teste H para o teste de Kruskal-Wallis (embora 
o SPSS a chame de qui-quadrado, em virtude 
da sua distribuigao, em vez de H), seu grau de 
liberdade associado, (nesse caso, temos quatro 
grupos, assim, o grau de liberdade e 4 — 1 ou 
3) e a significancia. E importante observar que 
o valor da significancia e 0,034; como esse 


Quadro 13.4 


Outras opgoes © 

Na caixa de dialogo principal existem outras opgoes que podem ser selecionadas: 

• Median (Mediana): Testa se as amostras sao retiradas de populagoes com a mesma me- 
diana. Assim, faz o mesmo teste que o de Kruskal-Wallis. Ela funciona produzindo uma 
tabela de contingencia dividida para cada grupo no numero de escores que se encontram 
acima e abaixo da mediana observada do conjunto total de dados. Se os grupos forem da 
mesma populagao, devemos esperar que essas frequences sejam as mesmas em todas 
as condigoes (aproximadamente 50% acima e 50% abaixo). 

• Jonckheere-Terpstra: Testa se as medias dos grupos seguem uma tendencia linear (veja 
a Segao 13.4.6). 
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Saida 13.8 do SPSS 13.8 

Ranks (Postos) 


Number of Soya 
Meals (Numero de 
refeigoes com soja) 

N 

Mean Rank 
(Media dos 
Postos) 

Sperm 

No Soya Meats (Sem 

20 

46.35 

Count 

refeigoes com soja) 



(Millions) 

7 Soya Meal per Week 

20 

44.15 

(Conta- 

(1 refeigao com soja por 



gem de 

semana) 



esperma- 

4 Soya Meal per Week 

20 

44.15 

tozoides 

(4 refeigoes com soja 



(Milhoes)) 

por semana) 




7 Soya Meal per Week 

20 

27.35 


(7 refeigoes com soja 




por semana) 




Total (Total) 

80 



Saida 13.9 do SPSS 

Test Statistics' u (Estatisticas Teste) 



Sperm Count 
(millions) 
(Contagem de 
Espermatozoides 
(Milhoes)) 

Chi-Square 

8.659 

(Qui-Qua- 


drado) 


df( gl) 

3 

Asymp. 

0.034 

Sig. (Sig. 


Assint.) 


Monte Car- Sig. (Sig.) 

0.033 3 

to (Monte 99% Con- Lower 

0.028 

Carlo) fidence Bound 


Interval (Limite 


(Intervalo Inferior) 


Sig. (Sig.) de 99% de Upper 

0.037 

Confianga.) Bound 


(Limite 


Superior) 



a Com base em 10000 tabelas amostradas com semente 
de partida 846668601. 
b Teste Kruskal-Wallis. 

c Variavel de Agrupamento: Numero de refeigoes com 
soja por semana. 


valor e menor do que 0,05, podemos concluir 
que a quantidade de refeigoes de soja ingeridas 
por semana afeta significativamente a conta- 
gem de espermatozoides. Note tambem que a 
estimativa por Monte Carlo da significancia e 


levemente menor (0,033). Esse e o valor a ser 
verificado em vez do valor assintotico se eles 
apresentarem resultados diferentes. O interva- 
lo de confianga para a significancia tambem e 
util: ele e 0,028 - 0,037 e o fato de que ele nao 
contem o zero e importante porque significa 
que o intervalo pode confer o valor da estatfs- 
tica teste com 99% de probabilidade. Isso nos 
da muita confianga de que o efeito e genurno. 
Como a ANOVA de um fator, da mesma for¬ 
ma, esse teste nos diz apenas que a diferenca 
existe; ele nao informa onde a diferenga esta. 

Uma forma de ver qual grupo difere e 
olhar para o diagrama de caixa e bigodes (veja 
a Segao 3.3.2) dos grupos (veja aFigura 13.7). 
Note que existem alguns valores atipicos (ob¬ 
serve os cfrculos e asteriscos que estao acima 
do bigode superior) - esses sao homens que 
produziram uma quantidade atfpica de es¬ 
permatozoides. Utilizando o controle como 
base, as medianas dos primeiros tres grupos 
parecem semelhantes, contudo, a mediana do 
grupo que fez sete refeigoes semanais com 
soja parece um pouco abaixo, assim, talvez a 
diferenga esteja af. Entretanto, essas conclu- 
soes sao subjetivas. O que realmente precisa- 
mos sao alguns contrastes ou testes post hoc 
como os utilizados na ANOVA (veja as Segoes 
8.2.10 e 8.2.11). 

13.4.5 Analise post hoc para o teste de 
Kruskal-Wallis © 

Existem duas ma- 
neiras de realizar pro- 
cedimentos post hoc 
nao-parametricos, a 
primeira com a utiliza- 
gao de testes de Mann- 
-Whitney (Segao 13.2). 

Contudo, se utilizarmos 
varios testes de Mann- 
-Whitney, iremos infla- 
cionar a taxa de erro do Tipo I (Segao 8.2.1) e 
e por esse motivo que nao comegamos fazendo 
muitos testes de Mann-Whitney! Contudo, po¬ 
demos realizar varios testes de Mann-Whit¬ 
ney em seguida a um teste de Kruskal-Wallis 
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■Z 20 , 00 - 


a) 

iO 

■c 


- 15,00- 


■o 

o 


a. 


a 

■B 

E 

a 

O) 

(O 

** 

c 

o 

U 


10 , 00 - 


5,00- 


0 , 00 - 



“I-1-1-1- 

Sem refeigoes Oma refeigao Quatro refeigoes Sete refeigoes 
com soja com soja com soja com soja 

porsemana por semana por semana 

Numero de refeigoes com soja por semana 


Figura 13.7 Diagrams de caixa e bigodes para a contagem de espermatozoides de pessoas inge- 
rindo um numero diferente de refeigoes com soja por semana. 


desde que seja feito algum tipo de ajuste para 
assegurar que o Erro do Tipo I nao ultrapasse 
o valor de 0,05. O metodo mais facil e utilizar 
a correcao de Bonferroni, que na sua forma 
mais simples significa que em vez de utilizar- 
mos um valor crftico de 0,05 para cada teste, 
devemos utilizar o valor 0,05 dividido pelo 
numero de testes que iremos realizar. Se voce 
fizer isso, logo ira descobrir que esta utilizan- 
do um valor para a significance tao pequeno 
que podera causar problemas. Dessa forma, 
e recomendavel ser bem seletivo nas compa- 
racoes realizadas. Nesse exemplo, temos um 
grupo-controle que nao tem refeigoes com 
soja; um bom e sucinto conjunto de compa- 
ragoes sera comparar cada grupo contra esse 
grupo-controle: 

► Teste 1: uma refeigao com soja por sema¬ 
na comparado com refeigoes sem soja; 

► Teste 2: quatro refeigoes com soja por 
semana comparado com refeigoes sem 
soja; 


► Teste 3: sete refeigoes com soja por sema¬ 
na comparado com refeigoes sem soja. 

Isso resulta em apenas tres testes, as- 
sim, em vez de utilizarmos 0,05 como nos- 
so valor crftico, devemos utilizar 0,05/3 = 
0,0167. Se nao utilizarmos testes apropria- 
dos e fizermos todas as comparagoes, tere- 
mos um total de seis testes em vez de apenas 
tres (sem soja vs. 1 refeigao, sem soja vs. 4 
refeigoes, sem soja vs. 7 refeigoes, 1 refei¬ 
gao vs. 4 refeigoes, 1 refeigao vs. 7 refeigoes 
e 4 refeigoes vs. 7 refeigoes) e o nosso valor 
crftico seria de 0,05/6 = 0,0083 em vez de 
0,0167. 

A Safda 13.10 do SPSS mostra as estatfs- 
ticas teste da realizagao dos testes de Mann- 
-Whitney nas tres comparagoes que foram su- 
geridas. A melhor forma de fazer isso no SPSS 
e alterar os valores dos codigos para os Grupos 
1 e 2 que foram digitados na caixa de dialogo 
Define Groups (Definir Grupos) (ver Figura 
13.3). Lembre que agora estamos utilizan- 
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do um valor crftico de 0,0167, assim, a unica 
comparagao significativa e a daqueles que ti- 
veram sete refeigoes com soja por semana com 
aqueles que nao tiveram refeigoes com soja na 
semana (porque o valor da significancia obser- 
vada foi de 0,009, que e menor do que 0,0167). 
As outras duas comparagoes produzem valores 
de significancia que sao maiores do que 0,0167 
assim, devemos afirmar que elas nao sao signi- 
ficativas. Desse modo, o efeito que obtivemos 
parece refletir principalmente o fato de que co¬ 
mer sete refeigoes com soja por semana (sei 
disso pelas medianas vistas na Figura 13.7) 
reflete em uma contagem menor de esperma- 
tozoides quando comparado a quem nao come 



soja. Contudo, comer um pouco de soja (de 
uma a quatro refeigoes semanais) parece nao 
afetar a contagem de espermatozoides. 

A segunda forma de reali- 
zar testes post hoc e essencial- 
mente a mesma de realizar tes¬ 
tes de Mann-Whitney para 
todas as possfveis compara¬ 
goes, mas mesmo assim irei guia-lo no proces- 
so! Ele e descrito por Siegel e Castellan (1988) 
e envolve tomar a diferenga entre as medias 
dos postos dos diferentes grupos comparada 
com um valor z (corrigido para o numero de 
comparagoes sendo feitas) e uma constante ba- 
seada no tamanho amostral total e as dos tama- 


Saida 13.10 do SPSS 


Sem soja versus uma refeigao com soja por semana: 

Test Statistics b (Estatisticas Teste) 



Sperm Count 
(millions) 
(Contagem de 
Espermatozoides 
(em Milhoes)) 

Mann-Whtiney 0/(UdeMann- 

191.000 

Whitney) 


Witcoxon W (W de Wilcoxon) 

401.000 

Z 

-0.243 

Asymp. Sig. (2-tailed) (Sig. Assint.) 

0.808 

(Bilateral) 


Exact Sig. [2*(1 -tailed Sig.) (Sig. 

0.820“ 

Exata) [2*(Sig. Unilateral) 



a Nao corrigido para empates. 
b Variavel de Agrupamento: Numero de refeigoes com 
soja por semana. 


Sem soja versus quatro refeigoes com soja por semana: 

Test Statistics 11 (Estatisticas Teste) 



Sperm Count 
(millions) 
(Contagem de 
Espermatozoides 
(em Milhoes)) 

Mann-Whtiney U (U de Mann- 

188.000 

Whitney) 


Witcoxon W (W de Wilcoxon) 

398.000 

Z 

-0.325 

Asymp. Sig. (2-tailed) (Sig. As- 

0.745 

sint.) (Bilateral) 


Exact Sig. [2*(1-tailed Sig.) (Sig. 

0.758 3 

Exata) [2*(Sig. Unilateral) 



a Nao corrigido para empates. 
b Variavel de Agrupamento: Numero de refeigoes com 
soja por semana. 


Sem soja versus sete refeigoes com soja por semana: 

Test Statistics 11 (Estatisticas Teste) 



Sperm Count 
(millions) (Contagem 
de Espermatozoides 
(em Milhoes)) 

Mann-Whtiney U (U de Mann-Whitney) 

104.000 

Witcoxon W (W de Wilcoxon) 

314.00 

Z 

-2.597 

Asymp. Sig. (2-tailed) (Sig. Assint.) 
(Bilateral) 

0.009 

Exact Sig. [2*(1-tailed Sig.) (Sig. Exata) 
[2*(Sig. Unilateral) 

009 a 


a Nao corrigido para empates. 

b Variavel de Agrupamento: Numero de refeigoes com soja por semana. 
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nhos amostrais dos dois grupos sendo compa- 
rados. Essa desigualdade e: 


\Ru~Rv 


Zatk(k-l) 


\N(N + 1) , 

f 1 + M 

1 12 

{n u n v ) 


(13.2) 


O lado esquerdo dessa equagao e apenas 
a diferen^a entre a media dos postos dos dois 
grupos sendo comparados, mas ignorando o si- 
nal dessa diferen 9 a (as duas linhas verticals que 
englobam a diferen^a entre a media dos postos 
significam que se a diferenga e negativa, nos de- 
vemos ignorar o sinal negativo e tratar a diferen- 
9 a como se ela fosse positiva). Para o resto da 
equa 9 ao, k 6 o numero de grupos (no exemplo 
da soja ele vale 4), N e o tamanho total da amos- 
tra (nesse caso, 80), n u eo numero de pessoas no 
primeiro grupo sendo comparado (como temos 
grupos de mesmo tamanho nesse exemplo, in- 
dependentemente do grupo esse valor sera igual 
a 20 ) e n v e o tamanho do segundo grupo sendo 
comparado (novamente, esse valor sera 20 inde- 
pendentemente do grupo sendo comparado, por- 
que, nesse exemplo, todos os grupos apresentam 
o mesmo tamanho). A ultima coisa que precisa- 
mos saber e z, a ^\ } , e para determinar esse valor 
precisamos decidir o nivel para a, que e o nivel 
de significancia que queremos trabalhar. Nas 
ciencias sociais tradicionalmente trabalhamos 
com um nivel de 0,05 de significancia, assim, a 
sera 0,05. Calculamos, entao k(k —1), que para 
esses dados sera 4 (4 — 1) = 12. Dessa forma, 
a/k(k — 1) = 0,05/12 = 0,00417. Assim, z a/k(k _ ]) 
apenas significa “o valor da curva normal para 
o qual somente a/k(k — 1 ) dos demais valores z 
sao maiores” (ou, nesse caso, “o valor z (curva 
normal) para o qual somente 0,00417% dos va¬ 
lores da curva normal estao acima”). Em termos 
praticos, isso significa que devemos procurar na 
tabela no Apendice A. 1 a coluna denominada 
Parte Menor e encontrar o numero 0,00417 (ou 
o valor mais proximo a ele, que, nesse caso, e 
0,00415), e depois olhar na mesma linha na co¬ 
luna z . Nesse caso, voce deve encontrar o valor 
de z igual a 2,64. O proximo passo e calcular o 
lado direito da equa 9 ao (13.2): 


Diferen 9 a _ 

. —Zulk(k-Y) 

Cntica 

= 2,64^540(0,1) = 2,64%/54 
= 19,40 

(13.2) 


IN(N+ 1), 

f 1 + M 

V 12 ' 

\n u n v ) 



Para esse exemplo, em virtude dos tama- 
nhos amostrais dos grupos serem os mesmos, 
essa diferen 9 a cntica pode ser utilizada em todas 
as compara 9 oes. Contudo, quando os tamanhos 
dos grupos forem diferentes, a diferen 9 a cntica 
devera ser calculada para cada compara 9 ao indi- 
vidualmente. A ultima etapa e calcular todas as 
diferen 9 as entre as medias dos postos de todos 
os grupos (esses valores podem ser encontrados 
na Saida 13.8 do SPSS) (Tabela 13.4). 

A equa 9 ao (13.2) significa 
basicamente que se as diferen- 
9 as entre as medias dos postos 
sao maiores ou iguais ao valor 



Tabela 13.4 Diferengas entre postos medios 
para os dados sobre soja 
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da diferenga crftica para aquela determinada 
comparagao, entao essa diferenca e significati- 
va. Nesse caso, como temos apenas uma dife¬ 
renga critica, qualquer diferenca que for maior 
do que 19,40 sera significativa. Como voce 
pode ver, todas as diferengas se encontram 
abaixo desse valor e, assim, conclufmos que 
nenhum dos grupos foi significativamente di- 
ferente! Isso contradiz nosso achado anterior 
em que o teste de Mann-Whitney para o grupo 
sem refeigoes com soja comparado ao grupo 
de sete refeigoes com soja por semana foi sig- 
nificativo. Por que voce acha que isso aconte- 
ceu? Para o nosso teste de Mann-Whitney, fi- 
zemos apenas tres comparagoes e, assim, 
corrigimos o valor da significancia para os tres 
testes (0,05/3 = 0,0167). Antes nesta segao, 
afirmei que se comparassemos todos os gru¬ 
pos entre si, existiriam seis comparagoes, e 
que, nesse caso, uma diferenga seria significa¬ 
tiva somente se o valor da significancia fosse 
menor do que 0,05/6 = 0,0083. Se voltarmos 
ao nosso teste de Mann-Whitney significativo 
(Saida 13.10 do SPSS), o valor da significan¬ 
cia foi de 0,009; portanto, se tivessemos feito 
todas as seis comparagoes, elas nao seriam 
significativas (porque 0,009 e maior do que 
0,0083)! Isso ilustra o que eu disse antes sobre 
as vantagens de selecionar as comparagoes a 
serem feitas. 

13.4.6 Testes para a tendencia: o teste 
de Jonckheere-Terpstra © 

Voltando a Segao 13.4.3, selecionamos 
uma opgao para o teste de Jonckheere-Terpstra, 
p Jonckheere-Terpsira (Jonckheere, 1954, Terpstra, 
1952). Essa estatfstica testa se as medianas 
dos grupos que estamos comparando seguem 
algum padrao de ordenagao. Essencialmen- 
te, ela faz o mesmo que o teste de Kruskal- 
-Wallis (isto e, testa a diferenga das medianas 
dos grupos), mas incorpora informagoes sobre 
se a ordem dos grupos tern alguma tendencia. 
Voce deve utilizar essa estatfstica quando es- 
pera que os grupos sendo comparados tenham 
algum padrao especffico com as medianas. As¬ 
sim, no exemplo atual, esperamos que quan¬ 
to mais soja a pessoa coma, mais a contagem 


de espermatozoides decresga. Dessa forma, o 
grupo-controle deve ter a contagem mais alta, 
os com uma refeigao por semana mais baixa, 
e os demais ainda menos. Assim, devemos 
perceber uma ordem nas nossas medianas: 
elas devem decrescer ao longo dos grupos. De 
forma contraria, devem existir situagoes onde 
podemos esperar que as medianas aumentem. 
Por exemplo, existe um fenomeno na psico- 
logia conhecido como “efeito da mera expo- 
sigao”, que significa basicamente que quanto 
mais voce for exposto a algo, mais voce gos- 
tara dele. Gravadoras utilizam esse efeito para 
assegurar que as musicas sejam tocadas nas 
radios por pelo menos dois meses antes dos 
seus langamentos, assim, no dia no langamen- 
to, muitos gostarao da musica e a levarao para 
os primeiros lugares nas paradas. 4 De qualquer 
modo, se voce pegar tres grupos e expo-los a 
ouvir uma musica 10, 20 e 30 vezes, respec- 
tivamente, e entao medir quanto cada pessoa 
gostou da musica, voce espera que a mediana 
aumente. Aqueles que a ouviram 10 vezes vao 
gostar um pouco menos daqueles que a ouvi¬ 
ram 20 vezes e esses, por sua vez, um pouco 
menos daqueles que a ouviram 30 vezes. 

O teste de Jonckheere-Terpstra (na maio- 
ria das vezes chamado apenas de teste de Jon¬ 
ckheere) foi projetado para essas situagoes. No 
SPSS, ele funciona com base no prinefpio de 
a variavel de codigo (a que define os grupos) 
especificar a ordem na qual se espera que as 
medianas mudem (nao importa se esperamos 
que elas aumentem ou diminuam). Assim, no 
nosso exemplo da soja, os grupos foram codi- 
ficados como 1 = sem soja, 2 = uma refeigao 
com soja por semana, 3 = quatro refeigoes 
com soja por semana e 4 = sete refeigoes com 
soja por semana, assim, o teste ira verificar se 
as medianas das contagens de espermatozoides 
aumentam ou diminuem ao longo dos grupos 
quando eles sao ordenados dessa forma. Obvia- 
mente, podemos alterar o esquema de codigos 
e testar se as medianas estao ordenadas de uma 
forma diferente. O funcionamento exato des- 


4 Embora em muitos casos a mera exposi^ao parece ter o 
efeito contrario para mim: quanto mais eu ougo certas 
musicas, mais quero que meu cerebro se livre delas. 
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se teste esta descrito no site www.artmed.com. 
br no arquivo Jonckheere.pdf, mas voce nao 
precisa dele para utilizar o teste. O mais impor- 
tante e testar se as medianas dos grapos estao 
em ordem crescente ou decrescente na ordem 
especificada pela varidvel codificadora. 

Vimos como especificar o teste na Segao 
13.4.3 e a Saida 13.11 do SPSS mostra o re- 
sultado do teste para os dados da soja. Essa 
tabela mostra o numero de grupos sendo corn- 
parados, 4 (caso voce ainda nao tenha notado). 
Ela apresenta, tambem, o valor da estatistica 
teste, J, que e 912. Em amostras grandes (mais 
do que oito elementos por grupo), essa estatis¬ 
tica teste tern uma distribuigao normal com a 
media e o desvio padrao facilmente definidos 
e calculados (veja o arquivo Jonckheere.pdf 
no site e voce ira encontrar que como a saida 
informa a media e 1200 e o desvio padrao e 
116,33). Sabendo esses valores, podemos con¬ 
verter a estatistica teste para o escore-z, que 
nesse caso vale: z = (912 - 1200)/116,33 = 
—2,476). Isso e semelhante ao que fizemos 


com os testes de Mann-Whitney e Wilcoxon. 
Esse escore-z pode entao ser comparado com 
os valores da distribuigao normal, e porque o 
teste de Jonckheere deve ser sempre unilateral 
(especificamos antes do experimento a ordem 
das medianas), estaremos procurando por um 
valor acima de 1,65 (quando ignoramos o si- 
nal). O valor 2,47 e, dessa forma, significati¬ 
ve. O sinal do valor-z nos informa a ordem das 
medianas. Se ele for positivo, elas estao em 
uma tendencia crescente, mas se ele e nega- 
tivo, como aqui, as medianas estao em ordem 
decrescente (as medianas diminuem a medi- 
da que a variavel de codigo aumenta). Nesse 
exemplo, as variaveis foram codificadas como 
1 = sem soja, 2 = uma refeigao com soja por 
semana, 3 = quatro refeigoes com soja por 
semana e 4 = sete refeigoes com soja por se¬ 
mana; isso significa que as medianas ficam 
menores a medida que avangamos de zero re¬ 
feigoes com soja a sete refeigoes com soja. 

Tambem podemos notar que existem va¬ 
lores significativos unilaterais e bilaterais es- 


Saida 13.11 do SPSS 

Jonckheere-Terpstra Test 16 (Teste de Jonckheere-Terpstra) 



Sperm Count (Millions) 
(Contagem de Espermatozoides 
em Milhoes) 

Number of Levels in Number of Soya Meats Per Week (Numero de niveis em 

4 

numero de refeigoes com soja por semana) 



N 



80 

Observed J-TStatistic (Estatistica J-T Observada) 


912.000 

Mean J-T Statistic (Media da Estatistica J-T) 


1200.000 

Std. Deviation of J-T Statistic (Desvio Padrao da Estatistica J-T) 






116.333 

Std J-T Statistic (Estatistica J-T Padro- 



-2.476 

nizada) 




Asymp. Sig. (2-tailed) (Sig. Assint. 



0.013 

(Bilateral)) 




Monte Carlo Sig. (2-tailed) (Sig. Mon- 

Sig. (Sig.) 


0.013 a 

te Carlo (Bilateral)) 

99% Confidence 

Lower Bound 

0.010 


Interval (Intervalo 

(Limite Inferior) 



de 99% de Con- 

Upper Bound 

0.016 


fianga.) 

(Limite Superior) 


Monte Carlo Sig. (l-tailed) (Sig. Mon- 

Sig. (Sig.) 


0.006 a 

te Carlo (Unilateral)) 

99% Confidence 

Lower Bound 

0.004 


Interval (Intervalo 

(Limite Inferior) 



de 99% de Con- 

Upper Bound 

0.008 


fianga.) 

(Limite Superior) 



a Com base em 10000 tabelas amostradas com semente de partida 846668601. 
b Variavel de Agrupamento: Numero de refeigoes com soja por semana. 
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timados com o uso do metodo Monte Carlo. 
Eles apareceram porque escolhemos essa op- 
gao para o teste de Kruskal-Wallis. Eles con- 
firmam o que ja tfnhamos encontrado. 

13.4.7 Calculando o tamanho de efeito © 

Infelizmente, nao existe uma forma simples 
de converter uma estatfstica qui-quadrado que 
tern mais do que um grau de liberdade em um 
tamanho de efeito r. Voce pode utilizar o valor 
da significancia da estatfstica teste de Kruskal- 
-Wallis para encontrar um valor associado de z 
a partir de uma tabela dos valores da distribui- 
gao normal (como a encontrada no Apendice 
A. 1). A partir daf voce pode utilizar a conversao 
para r utilizada na Segao 13.2.5. Contudo, esse 
tipo de tamanho de efeito e raramente util (por¬ 
que ele esta representando um efeito geral). Em 
muitos casos, e mais interessante saber o tama¬ 
nho de efeito para uma comparagao especffica 
(como a comparagao de dois grupos). Por esse 
motivo, sugiro calcular o tamanho de efeito 
para os testes de Mann-Whitney que utilizamos 
para acompanhar a analise principal. 

Para a primeira comparagao (sem soja ver¬ 
sus uma refeigao com soja), a Saida 13.10 do 
SPSS mostra que z e —0,243, e porque ele teve 
por base a comparagao de dois grupos, cada um 
contendo 20 observagoes, temos 40 observagoes 
no total. O tamanho de efeito sera, portanto: 


f 0 Soja vs. 1 Soja 


-0,243 

V40 

-0,04 


Isso representa um efeito muito pequeno: o 
valor esta proximo de zero, o que informa que o 
efeito na contagem de espermatozoides de uma 
refeigao com soja por semana e desprezfvel. 

Para a segunda comparagao (refeigao sem 
soja versus quatro refeigoes com soja) a Safda 
13.10 do SPSS mostra que z e —0,325, nova- 
mente tendo por base 40 observagoes. O tama¬ 
nho de efeito sera: 


F 0 Soja vs. 4 Soja 


-0,325 

V40 

-0,05 


Mais uma vez temos um efeito desprezfvel, 
pois o valor esta proximo de zero, significando 
que o efeito na contagem de espermatozoides 
de quatro refeigoes com soja por semana e qua- 
se nulo. 

Para a comparagao final (refeigao sem 
soja versus sete refeigoes com soja) a Safda 
13.10 do SPSS mostra que o valor de z = 
—2,597 com base em 40 observagoes. Assim, 
o tamanho de efeito e: 


ro Soja vs. 7 Soja 


-2,597 

-0,41 


Isso representa um efeito medio, o que nos 
informa que sete refeigoes com soja por semana 
baixa a quantidade de espermatozoides (quando 
comparado a nenhuma refeigao com soja por 
semana), o que e um achado significante. 

Podemos calcular ainda o tamanho de efei¬ 
to para o teste de Jonckheere se quisermos uti¬ 
lizar a mesma equagao. Isso envolve todos os 
dados, entao teremos 80 como valor de N: 


^"jonckheere — 


-2,476 

s/80 


= -0,28 


13.4.8 Escrevendo e interpretando os 
resultados © 

Para o teste de Kruskal-Wallis, preci- 
samos relatar apenas a estatfstica teste (que, 
como vimos antes, e representada por H), seus 
graus de liberdade e sua significancia. Assim, 
podemos escrever que: 

/ A contagem de espermatozoides foi signi- 
ficativamente afetada pela ingestao de re¬ 
feigoes com soja (H(3) = 8,66, p < 0,05). 

Entretanto, precisamos relatar os testes de 
acompanhamento (incluindo os tamanhos de 
efeito): 

/ A contagem de espermatozoides foi signi- 
ficativamente afetada pela ingestao de re¬ 
feigoes com soja (H(3) = 8,66, p < 0,05). 
Testes de Mann-Whitney foram utiliza- 
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dos para acompanhamento desse achado. 
Uma corregao de Bonferroni foi aplicada 
e todos os efeitos foram testados no nfvel 
de 0,0167 de significancia. Pareceu que a 
contagem de espermatozoides nao apre- 
sentou diferengas com uma refeigao com 
soja por semana (U = 191, r = —0,04) ou 
com quatro refeicoes por semana (U = 
188, r = —0,05) quando comparadas com 
refeicoes sem soja. Contudo, quando sete 
refeigSes de soja por semana foram obser- 
vadas, a contagem de espermatozoides foi 
significativamente menor do que quando 
comparada com refeigSes sem soja (U = 
104, r = —0,41). Podemos concluir que se 
a soja for comida todo dia ela reduz sig¬ 
nificativamente a contagem de espermato¬ 
zoides comparada com a nao ingestao de 
soja; contudo comer soja frequentemente 
mas nao todos os dias nao apresenta efei¬ 
tos significativos na contagem de esperma¬ 
tozoides! 

Ou podemos relatar a tendencia observada: 

V Todos os efeitos sao relatados ao nfvel p 
< 0,05. A contagem de espermatozoides 
e significativamente afetada pela ingestao 
de refeigoes com soja (H(3) = 8,66). O 
teste de Jonckheere revelou uma tenden¬ 


cia significativa nos dados de quanto mais 
soja e ingerida mais a mediana da conta¬ 
gem de espermatozoides descresce, J = 
912, z = -2,48, r = -0,28. 

13.5 DIFERENQAS ENTRE VARI0S 
GRUP0S RELACI0NAD0S: 

A ANOVA DE FRIEDMAN© 

No capltulo 11, descobrimos uma tecni- 
ca denominada ANOVA de um fator que pode 
ser utilizada para testar diferengas entre varios 
grupos relacionados. Embora, como vimos, a 
ANOVA seja robusta a violagSes de seus pres- 
supostos, existe uma alternativa para o caso 
de medidas repetidas: a ANOVA de Friedman 
(1937). Ela e utilizada para testar diferengas 
entre condigoes experimentais quando exis- 
tem mais do que duas condigoes e os mesmos 
participantes foram utilizados em todas as 
condigoes (cada pessoa contribuiu com varias 
medidas para os dados). Se tivermos dados 
nao normalmente distribuldos ou tivermos ou- 
tra suposigao violada, esse teste pode ser util 
para contornar o problema. 

Pessoas jovens (mulheres principalmen- 
te) podem tornar-se obsessivas em relagao ao 
peso e dietas, e em virtude da mfdia estar in- 


r -;- 

Dica da Samanta Ferrinho 





V 


• O teste de Kruskal-Wallis compara varias condigoes quando diferentes pessoas 
participam em cada condigao e os dados resultantes nao sao normalmente dis- 
tribuidos ou nao satisfazem a hipotese da ANOVA independente de um fator. 

• Observe a linha Sig. Assint. {Asymp. Sig.): se o valor for menor do que 0,05, os 
grupos sao significativamente diferentes. 

• Voce pode reaiizar um acompanhamento da analise principal com testes em pa¬ 
res de Mann-Whitney, mas so devera aceita-los como significativos se eles tive- 
rem uma significancia inferior a 0,05/numero de testes. 

• Se voce preve que as medias irao aumentar ou diminuir junto com os grupos em 
certa ordem, utilize o teste de tendencia de Jonckheere para confirmar ou nao 
a previsao. 

• Relate a estatistica H, os graus de liberdade e o valor da significancia para a ana¬ 
lise principal. Para qualquer test e post hoc, relate a estatistica e um tamanho de 
efeito se possivel (voce pode ainda apresentar o valor de z correspondente e o 
valor da significancia). Relate ainda as medianas e suas amplitudes correspon- 
dentes (ou faga um diagrams de caixa e bigodes). 
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sistentemente veiculando imagens de celebri- 
dades ridiculamente magras e altas e fazendo 
lavagens cerebrais para que acreditemos que 
esses cabides sao corpos atraentes, nos fica- 
mos deprimidos com nossas imperfeiijSes. 
Assim, outros parasitas se aproveitam da nos- 
sa vulnerabilidade ganhando rios de dinhei- 
ro com dietas que supostamente irao deixar 
nossos corpos maravilhosos! Nao querendo 
perder essa grande oportunidade de explorar 
a inseguranca das pessoas, apresento minha 
propria dieta: a “dieta Andikins.” 5 O princfpio 
basico e que voce se comporte como eu: nao 
coma carne, tome muito cha Darjeeling, coma 
muito queijo europeu, grande quantidade de 
pao crocante e fresquinho, massa e chocolate 
em qualquer oportunidade dispomvel (espe- 
cialmente quando estiver escrevendo livros), 
deguste algumas cervejas no final de semana, 
jogue futebol e rugbi pelo menos duas ve- 
zes por semana e toque bateria por pelo me¬ 
nos uma hora por dia ate que sua namorada 
ameace cortar fora os seus bravos e bater na 
sua cabeca com eles por fazer muito barulho. 
Para testar a eficacia da minha maravilhosa 
dieta, escolhi 10 mulheres que achavam que 
deviam perder algum peso e as coloquei na 


5 Nao confundir com a dieta de Atkins, obviamente. © 


dieta por dois meses. Os seus pesos foram 
mensurados em quilogramas no inicio da die¬ 
ta, apos um mes e no final do segundo mes. 


13.5.1 Teoria da ANOVA de Friedman 



A teoria da ANOVA de 
Friedman e semelhante a dos 
outros testes vistos neste capf- 
tulo: ela e baseada nos postos 
dos dados. Para cornecar, voce 
simplesmente coloca os dados para as dife- 
rentes condicoes em colunas diferentes (nes- 
se caso, existent tres condicoes, portanto te- 
remos tres colunas). Os dados para o exemplo 
da dieta estao na Tabela 13.5; note que os da¬ 
dos estao em colunas diferentes, desse modo, 
cada linha representa o peso de uma pessoa 
diferente. Em seguida, precisamos determi- 
nar os postos dos dados para cada pessoa. As¬ 
sim, come^amos com a pessoa 1, olhamos 
para o seu peso ou escore (verificamos que 
ela pesava 63,75 kg no infcio, 65,38 no final 
do primeiro mes e 81,34 kg no final do se¬ 
gundo mes de dieta), entao atribufmos ao me- 
nor valor o posto 1. ao seguinte o posto 2 e 
assim por diante (veja a Segao 13.2.1 para 
mais detalhes). Quando voce tiver determina- 
do todos os postos para a primeira pessoa, 
passe para a segunda e assim por diante. Faga 


Tabela 13.5 Dados para o exemplo da dieta com postos 




Peso 



Peso 



Inicio 

Mes 1 

Mes 2 

Postos do 
Inicio 

Postos do 
mes 1 

Postos do 
mes 2 

Pessoa 1 

63,75 

65,38 

81,34 

1 

2 

3 

Pessoa 2 

62,98 

66,24 

69,31 

1 

2 

3 

Pessoa 3 

65,98 

67,70 

77,89 

1 

2 

3 

Pessoa 4 

107,27 

102,7 

91,33 

3 

2 

1 

Pessoa 5 

66,58 

69,45 

72,87 

1 

2 

3 

Pessoa 6 

120,46 

119,96 

114,26 

3 

2 

1 

Pessoa 7 

62,01 

66,09 

68,01 

1 

2 

3 

Pessoa 8 

71,87 

73,62 

55,43 

2 

3 

1 

Pessoa 9 

83,01 

75,81 

71,63 

3 

2 

1 

Pessoa 10 

76,62 

67,66 

68,60 

3 

1 

2 




*/ 

19 

20 

21 
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isso para todas as pessoas para as quais os da¬ 
dos foram coletados. Depois, simplesmente 
adicione os postos de cada condigao (R ; onde 
i e utilizado para representar um grupo). A 
Tabela 13.5 mostra os dados brutos para esse 
exemplo mais os postos (tente determina-los 
e veja se obtem os mesmos resultados apre- 
sentados aqui!). 

Com a soma dos postos calculada para 
cada grupo, a estatistica teste, F r , e calculada 
pela equagao (13.3): 


F r = 



-3N(k + Y) 


(13.3) 


Nessa equagao, R ; e a soma dos postos 
para cada grupo, IV e o total da amostra (nesse 
caso, 10) eieo numero de condigoes (nesse 
caso, 3). Essa equagao e bastante semelhan- 
te a do teste de Kruskal-Wallis (compare as 
equagdes (13.1) e (13.3)). Tudo o que precisa- 
mos fazer para cada condigao e elevar a soma 
dos postos ao quadrado e somar esses valores. 
Isso resolve o meio da equagao; o resto dela 
envolve calcular varios valores com base no 
tamanho total da amostra e no numero de con¬ 
digoes. Para esses dados, temos: 


F r = 


12 


(19 2 H- 20 2 + 21 2 ) 


L(10x 3X3 + 1) 

-(3xlO)(3 + l) 

= —(361 + 400 + 441)-120 
120 

= 0,1(1202)-120 
= 120,2-120 
= 0,2 



Quando o numero de pes¬ 
soas testadas e grande (maior 
do que 10), essa estatistica tes¬ 
te, como a de Kruskal-Wallis 
na segao anterior, tern uma dis- 
tribuigao qui-quadrado (veja o Capitulo 16) e 
para essa distribuigao existe um valor para os 
graus de liberdade, que e um menos que o nu¬ 
mero de grupos (k- 1); nesse caso, 2. 


13.5.2 Atribuindo dados e fazendo 
analise condicional 0 

Quando os dados sao coletados utilizando 
os mesmos participantes em cada condigao, 
eles precisam ser apresentados em diferentes 
colunas. Assim, o editor de dados tera tres co- 
lunas de dados. A primeira coluna e para os 
dados do inicio da dieta (denominada Start), 
a segunda coluna tera os pesos apos um mes 
de dieta (denominada month 1) e a coluna fi¬ 
nal tera os pesos do final da dieta (denominada 
month2). Esses dados podem ser encontrados 
no arquivo denominado Diet.sav. 

Primeiro execute uma analise exploratoria 
nos dados (veja o Capitulo 3). Com um pouco 
de sorte, voce ira obter uma tabela semelhante 
a da Saida 13.12 do SPSS, que mostra que o 
teste K-S (veja a Segao 3.5) nao foi significa¬ 
tive para os pesos do inicio da dieta (D(10) = 
0,23, P > 0,05), mas o teste de Shapiro-Wilk e 
significativo e esse teste e, de fato, mais preci- 
so do que o teste K-S (veja o Capitulo 3). Os 
dados do final do primeiro mes de dieta foram 
significativamente diferentes da normal (D( 10) 
= 0,34, p < 0,01), embora os dados do final do 
segundo mes da dieta paregam normais ( D( 10) 
= 0,20, p > 0,05). Alguns desses dados nao 
sao normalmente distribuidos, assim, devemos 
utilizar testes nao-parametricos. 

13.5.3 Executando a AN0VA de 
Friedman no SPSS 0 

Acesse a caixa de dialogo principal uti¬ 
lizando o menu Analyze=>Nonparame- 
tric Tests=>K Related Samples... (Anali- 
sar=>Testes Nao-parametricos=>K Amostras 
Relacionadas...) (veja a Figura 13.8). Com a 
caixa de dialogos ativa, selecione as tres va¬ 
riaveis dependentes da lista (clique em start 
e, entao, mantendo o botao do mouse pressio- 
nado, arraste o mouse sobre monthl e mon- 
th2). Transfira as variaveis para o quadro Test 
Variables (Variaveis de Teste ) clicando em 
jJ. Se voce clicar em i E,acl - 1 (Exato), obte- 
ra uma caixa de dialogo para selecionar o va¬ 
lor exato da significancia para a ANOVA de 
Friedman (veja a Segao 13.2.3). Lembre que 
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Saida 13.12 do SPSS 


Tests of Normality (Testes de Normalidade) 



Kolmogorov-Smirnov 1 

Shapiro-Wilk 


Statistic 

df 

Sig. 

Statistic 

df 

Sig. 


(Estatistica) 

(gi) 

(Sig.) 

(Estatistica) 

(gi) 

(Sig.) 

Weight at Start (Kg) (Peso, em kg, no inicio) 

0.228 

10 

0.149 

0.784 

10 

0.009 

Weight after 1 month (Kg) (Peso, em kg, apos 1 mes) 

0.335 

10 

0.002 

0.685 

10 

0.001 

Weight after 2 month (Kg) (Peso, em kg, apos 2 meses) 

0.203 

10 

0.200* 

0.877 

10 

0.121 


* Esse e um limite inferior da verdadeira significancia. 
a Corregao da significancia de Lilliefors. 



Several Related Samples: Stat. 


H Descriptive 
I” Quartiles 


Continue | 

Cancel 


Help 


Figura 13.8 Caixas de dialogo para ANOVA de Friedman. 


eu disse que quando as amostras sao grandes, 
voce deve provavelmente optar pelo metodo 
de Monte Carlo, mas com pequenas amostras 
vale a pena optar pelo teste exato. Voce tern 
uma amostra de tamanho pequeno aqui, assim, 
pode optar pela significancia exata. Finalmen- 
te, clique em I sm»tc (Estatfsticas) para sele- 
cionar algumas estatfsticas descritivas. Para 
obter a analise, retorne a caixa de dialogos 
principal e clique em <* . Voce pode tambem 
realizar alguns testes relacionados utilizando a 
mesma caixa de dialogo da ANOVA de Fried¬ 
man (veja o Quadro 13.5). 


13.5.4 Saidas para a ANOVA de 
Friedman ® 

Como vimos, a ANOVA de Friedman, as¬ 
sim como todos os testes nao-parametricos des- 
te capftulo, e baseada em postos e nao nos dados 
mensurados. A Saida 13.13 do SPSS mostra a 
media dos postos em cada condigao. Essas me- 
dias sao importantes para mais tarde interpretar- 
mos qualquer efeito: elas mostram que os postos 
sao semelhantes ao longo das condigoes. 

A Saida 13.14 do SPSS mostra a estatfs- 
tica teste (o SPSS a chama de qui-quadrado 
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Quadro 13.5 


Outras opgoes © 

Na caixa de dialogo principal existem algumas outras opgoes que podem ser selecionadas: 

• Kendall's W: (W de Kendall): Esse teste e bastante semelhante a ANOVA de Friedman, 
mas e utilizado especificamente para verificar a concordancia entre razoes (taxas). Assim, 
se, por exemplo, solicitassemos a 10 mulheres diferentes para avaliar a atratividade de 
Justin Timberlake, David Beckham e Tony Blair, poderiamos utilizar esse teste para verifi¬ 
car o quanto elas concordam. Esse teste e particularmente util porque, como o coeficiente 
de correlagao, o W de Kendall tern uma variagao limitada: ele vai de 0 (nenhuma concor¬ 
dancia entre os julgadores) a 1 (concordancia completa entre os juizes). 

• Cochran's Q (Q de Cochran). E uma extensao do teste de McNemar (veja o Quadro 13.3), 
e e basicamente um teste de Friedman para quando os dados sao dicotomicos. Assim, 
imagine que voce perguntou para 10 mulheres se elas gostariam de abragar e beijar Justin 
Timberlake, David Beckham e Tony Blair e elas so poderiam responder sim ou nao. Se 
as respostas fossem codificadas como 0 (nao) e 1 (sim), poderiamos realizar um teste de 
Cochran nesses dados. 


Saida 13.13 do SPSS 

Descriptive Statistics (Estatisticas Descritivas) 





Std. 

Deviation 

(Desvio 

Padrao) 



Percentiles (Percentis) 


N 

Mean 

(Media) 

Minimum 

(Minimo) 

Maximum 

(Maximo) 

25th 

(25°) 

50 th 

(Median) (50° 
Mediana) 

75th 

(75°) 

Weight at Start (Kg) (Peso, 
em kg, no inicio) 

10 

78.0543 

20.23008 

62.01 

120.46 

63.5549 

69.2288 

89.0709 

Weight after 1 month (Kg) 
(Peso, em kg, apos 1 mes) 

10 

77.4635 

18.61502 

65.38 

119.96 

66.2065 

68.5728 

82.5385 

Weight after 2 month (Kg) 
(Peso, em kg, apos 2 meses) 

10 

77.0668 

16.10612 

55.43 

114.26 

68.4525 

72.2493 

83.8365 


Ranks (Postos) 



Mean Rank 
(Posto Medio) 

Weight at Start (Kg) (Peso, em kg, no inicio) 

1.90 

Weight after 1 month (Kg) (Peso, em kg, apos 1 mes) 

2.00 

Weight after 2 month (Kg) (Peso, em kg, apos 2 meses) 

2.10 


em vez de F r porque a F r tem uma distribuigao 
qui-quadrado). O valor dessa estatistica e 0,20, 
o mesmo valor que calculamos anteriormente. 
Tambem ja mencionamos os graus de liber- 
dade da estatistica teste (nesse caso, existem 
tres grupos, assim, os graus de liberdade sao: 
3 - 1 = 2) e a significancia. Se voce solicitar 


a significancia exata, esse valor tambem sera 
calculado. O valor da significancia e 0,905 
(ou 0,974 se voce ler a significancia exata), o 
que esta bem acima de 0,05; dessa forma, po- 
demos concluir que a dieta Andikins nao tem 
qualquer efeito: os pesos nao mudaram signi- 
ficativamente ao longo do perfodo da dieta. 
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Saida 13.14 do SPSS 


Test Statistics a (Estatisticas Teste) 


N 

10 

Chi-Square (Qui-Quadrado) 

0.200 

oV(gD 

2 

Asymp. Sig. (Sig. Assint.) 

0.905 

Exact Sig. (Sig. Exata) 

0.974 

Point Probability (probabilidade do valor) 

0.143 


a Teste de Friedman. 


13.5.5 Analiseposf hoc para a ANOVA 
de Friedman © 

Como para o teste de Kruskal-Wallis, 
existem duas formas de realizar os procedi- 
mentos nao-parametricos post hoc , que, na 
essencia, sao os mesmos. O primeiro e utili- 
zar o teste dos postos com sinais de Wilco- 
xon (Se£ao 13.3), mas com corregao para o 
numero de testes que serao realizados (veja 
as Seijoes 8.2.1 e 13.4.5 para lembrar os mo- 
tivos). A forma de corrigir para o numero de 
testes e aceitar somente como significativo se 
a significancia do resultado for inferior a a 
dividido pelo numero de comparacdes reali- 
zadas (a correcao de Bonferroni). Nas cien- 
cias sociais, isso significa normalmente 0,05 
dividido pelo numero de comparacdes. Nesse 
exemplo, temos somente tres grupos, assim, 
se compararmos todos os grupos teremos tres 
comparacdes: 

► Teste 1: Peso no infcio da dieta compara- 
do com o peso apos um mes; 

► Teste 2: Peso no infcio da dieta compara- 
do com o peso apos dois meses; 

► Teste 3: Peso apos um mes de dieta com- 
parado com o peso apos dois meses. 

Dessa forma, em vez de utilizarmos o nf- 
vel de significancia de 0,05, vamos utilizar o 
valor 0,05/3 = 0,0167. Nao vamos nos inco- 
modar com testes post hoc nesse exemplo, por- 
que a ANOVA principal nao foi significativa, 
mas iremos apresentar o processo para ilustrar 
como ele deve ser feito. Voce pode realizar os 
testes de Wilcoxon selecionando os pares de 
variaveis de cada comparacao e transferindo- 
-as para o quadro Test Pair(s) List (Lista de 
pares do teste) (veja a Figura 13.4). 



A Safda 13.15 do SPSS 
mostra a estatfstica teste da rea- 
lizacao do teste dos postos com 
sinais de Wilcoxon para todas 
as tres comparacdes. Lembre 
que agora estamos considerando um valor crfti- 
co de 0,0167 e, de fato, nenhuma das compara¬ 
cdes e significativa pois elas apresentam valo- 
res de significancia unilaterais de 0,500, 0,423 
e 0,461 (isso nao e surpreendente porque a ana- 
lise principal nao foi significativa). 

A segunda forma de realizar os testes post 
hoc e muito semelhante ao que foi feito para 
o teste de Kruskal-Wallis na Secao 13.4.5 e 
e, tambem, descrita por Siegel e Castellan 
(1988). Novamente, tomamos as difcrenpas 
entre os postos medios dos diferentes grupos 
e comparamos essas diferencas a um valor ba- 
seado no valor z (corrigido para o numero de 
comparacdes sendo realizadas) e uma cons- 
tante com base no total da amostra, A (10 para 
esse exemplo) e o numero total de condicoes, 
k (3, nesse caso). Essa desigualdade e: 


I-^m Rv I ^ Za/k(k-l) 


k(k + 1) 


6 N 


(13.4) 


O lado esquerdo da equapao e a diferenca 
entre as medias dos postos dos dois grupos 
sendo comparados, mas onde o sinal e igno- 
rado. Como ocorreu com o teste de Kruskal- 
-Wallis, precisamos saber o valor de z a/k(k+1) e 
se ficarmos com o nosso valor tradicional de 
0,05, sabendo que k = 3, teremos a/klk - 1) 
= 0,05/3(3 - 1) = 0,05/6 = 0,00833. Assim, 
Z a/k(k-i) apenas significa “o valor de z para o 
qual somente a/k(k - 1) dos demais valores 
sao maiores” (ou, nesse caso, “o valor de z 
para o qual somente 0,833% dos demais va¬ 
lores sao maiores”). Portanto, olhe a tabela 
no Apendice A. 1 e procure na coluna Parte 
Menor o valor 0,00833, ou o mais proximo, 
e depois busque o valor na mesma linha na 
coluna z. Nesse caso, existem os valores de 
0,00842 e 0,00820 que fornecem os valores- 
-z de 2,39 e 2,40, respectivamente; como o 
valor 0,00833 esta entre esses dois valores 
que encontramos, podemos tomar a media 
dos escores-z, ou seja, 2,395, ou podemos ser 
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Saida 13.15 do SPSS 


Ranks (Postos) 




Mean Rank 

Sum of Rank 


N 

(Posto Medio) 

(Soma dos Postos) 

Weight after 1 month (Kg) - Wei- Negative Ranks (Postos Negativos) 

4 a 

7.00 

28.00 

ght at Start (kg) (Peso, em kg, apos Positivie Ranks (Postos Positivos) 

6 b 

4.50 

27.00 

1 mes - Peso, em kg, no inicio) Ties (Empates) 

0 C 



Totai (Total) 

10 



Weight after 2 month (Kg) - Wei- Negative Ranks (Postos Negativos) 

5 d 

6.00 

30.00 

ght at Start (kg) (Peso, em kg, apos Positivie Ranks (Postos Positivos) 

5 e 

5.00 

25.00 

2 meses - Peso, em kg, no inicio) Ties (Empates) 

O' 



Total (Total) 

10 



Weight after 2 month (Kg) - Wei- Negative Ranks (Postos Negativos) 

49 

7.25 

29.00 

ght after 1 month (kg) (Peso, em Positivie Ranks (Postos Positivos) 

6 h 

4.33 

26.00 

kg, apos 2 meses - Peso, em kg. Ties (Empates) 

0 1 



apos 1 mes) Total (Total) 

10 




a Peso, em kg, apos 1 mes < Peso, em kg, no inicio. 
b Peso, em kg, apos 1 mes > Peso, em kg, no inicio. 
c Peso, em kg, apos 1 mes = Peso, em kg, no inicio. 
d Peso, em kg, apos 2 meses < Peso, em kg, no inicio. 
e Peso, em kg, apos 2 meses > Peso, em kg, no inicio. 
f Peso, em kg, apos 2 meses = Peso, em kg, no inicio. 
g Peso, em kg, apos 2 meses < Peso, em kg, apos um mes. 
h Peso, em kg, apos 2 meses > Peso, em kg, apos um mes. 
i Peso, em kg, apos 2 meses = Peso, em kg, apos um mes. 


Test Statistics b (EstatisticasTeste) 



Weight after 1 month 
(kg) - Weight at Start (Kg) 
(Peso, em kg, apos 1 mes 
- Peso, em kg, no inicio) 

Weight after 2 month 
(Kg) - Weight at Start (Kg 
(Peso, em kg, apos 2 meses 
- Peso, em kg, no inicio) 

Weight after 2 month (Kg) - 
Weight after 1 month (kg) 
(Peso, em kg, apos 2 meses 
- Peso, em kg, apos 1 mes) 

Z 

-0.051 a 

-0.255 3 

-0.153 a 

Asymp. Sig. (2-tailed) 
(Sig. Assint. (bilateral)) 

0.959 

0.799 

0.878 

Exact Sig. (2-tailed) 

(Sig. Exata (unilateral)) 

1.000 

0.846 

0.922 

Exact Sig. (1-tailed) 

(Sig. Exata (unilateral)) 

0.500 

0.423 

0.461 

Point Probability (Pro- 
babilidade Pontual) 

0.039 

0.038 

0.038 


a Baseado em postos positivos. 
b Testes de Postos com Sinais de Wilcoxon. 


cautelosos e utilizar o valor 2,39, ou atrevi- 
dos e utilizar o valor 2,40. De qualquer for¬ 
ma, agora podemos calcular o lado direito da 
equagao (13.4): 


Di fcrcnca critica = 


Zoclkfk- 1) 


k(k + l) 
6 N 


= 2,40, 


3(3+1) 

6 ( 10 ) 



= 2,40 > /(U 
= 1,07 


Como as mesmas pessoas foram utiliza- 
das, a mesma diferenga critica pode ser usada 
em todas as comparagoes. O proximo passo e 
calcular todas as diferengas entre as medias 
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dos postos de todos os grupos (as medias dos 
postos podem ser encontradas na Saida 13.13 
do SPSS): 


Tabela 13.6 Diferengas entre postos medios 
para os dados da dieta 


Comparagao 

Ru 

A, 



Inicio - Primei¬ 
ro mes 

1,90 

2,00 

-0,10 

0,10 

Inicio - Segun¬ 
do mes 

1,90 

2,10 

-0,20 

0,20 

Primeiro mes - 
Segundo mes 

2,00 

2,10 

-0,10 

0,10 



A equacao (13.4) significa 
que se as diferengas entre os 
postos medios sao maiores ou 
iguais a diferenca crftica, essa 
diferenga e significativa. Nes- 
se caso, isso significa que se uma diferenga 
for maior do que 1,07, ela sera significativa. 
Todas as diferengas estao abaixo desse valor 
(Tabela 13.6), assim, podemos concluir que 
nenhum dos grupos difere significativamente 
e isso e consistente com a nao-significancia 
inicial da ANOVA. 


do teste de postos com sinais de Wilcoxon. De 
forma alternativa, podemos calcular tamanhos 
de efeito para os testes de Wilcoxon que foram 
utilizados como seguimento da analise princi¬ 
pal. Esses efeitos serao bastante informativos 
na sua forma apropriada. 

Para a primeira comparagao (inicio versus 
final do primeiro mes), a Saida 13.15 do SPSS 
mostra que z e —0,051, e porque esse valor foi 
obtido com base na comparagao de duas condi- 
goes contendo 10 observagoes, temos 20 obser¬ 
vagoes no total (lembre que o fato das observa¬ 
goes terem sido feitas nas mesmas pessoas nao 
importa aqui). O tamanho de efeito e: 


^Infcio mes I 


-0,051 

J20 

-0,01 


Para a segunda comparagao (inicio versus 
final do segundo mes), a Saida 13.15 do SPSS 
mostra que z e —0,255 e isso teve como base 
20 observagoes. O tamanho de efeito sera: 


r Inicio—mes 2 


-0,255 

s/20 

-0,06 


13.5.6 Calculando o tamanho de efeito © 

Como mencionado anteriormente, nao 
existe uma forma facil de converter uma esta- 
tistica qui-quadrado que tern mais de um grau 
de liberdade em um tamanho de efeito r e, de 
qualquer modo, nem sempre interessa ter um 
tamanho de efeito geral como o testado pela 
ANOVA de Friedman. 6 Contudo, existe uma 
maneira mais sensata (em minha opiniao, ao 
menos) de calcular tamanhos de efeito para 
qualquer comparagao que tenhamos feito na 
ANOVA. Como vimos na Segao 13.3.5, e sim¬ 
ples obtermos um tamanho de efeito r a partir 


6 Se quiser, entao, voce pode (como no caso do teste de 
Kruskal-Wallis) utilizar o valor da significancia da esta- 
tfstica teste qui-quadrado para encontrar um valor asso- 
ciado de z a partir de uma tabela de valores de probabili- 
dade para a distribuigao normal (veja o Apendice A.l) e 
entao converte-lo para r como ja foi visto neste capftulo. 


Para a comparagao final (final do mes 1 
versus final do mes 2) a Saida 13.15 do SPSS 
mostra que z e —0,153 e esse valor foi nova- 
mente baseado em 20 observagoes. Assim, te- 
remos para o tamanho de efeito: 

_ -0,153 

Tnesl — mes 2— /- 

s/20 

= -0,03 

De forma nao surpreendente, dada a 
nao-significancia dos testes de Wilcoxon, to¬ 
das representam um efeito praticamente ine- 
xistente: todas estao muito proximos de zero. 

13.5.7 Escrevendo e interpretando os 
resultados © 

Para a ANOVA de Friedman precisamos 
somente relatar a estatistica teste (que, como 
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ja vimos, e representada por / 2 ), 7 os graus de 
liberdade e a significancia. Assim, podemos 
escrever que: 

V O peso dos participantes nao mudou sig- 
nificativamente ao longo dos dois meses 
de dieta (* 2 (2) = 0,20, p > 0,05). 

Embora sem a significancia da analise 
inicial, queremos relatar os testes post hoc 
para esses dados, caso voce tenha que faze-lo. 
Assim, voce deve afirmar que (lembre que a 
estatistica teste T6 o menor valor das duas so- 
mas de postos para cada teste e esses valores 
estao na Saida 13.15 do SPSS): 

V O peso dos participantes nao mudou sig- 
nificativamente ao longo dos dois meses 
de dieta (x 2 (2) = 0,20, p < 0,05). Testes 
de Wilcoxon foram utilizados para acom- 
panhar esses achados. Uma corregao de 
Bonferroni foi aplicada e todos os efeitos 
foram testados com um nivel de signifi¬ 
cancia de 0,0167. Pareceu que os pesos 
nao sofreram alteracoes significativas do 
inicio da dieta ate o primeiro mes T = 27, 
r = —0,01, do inicio da dieta ate o segun- 
do mes, T = 25, r = —0,06 e do primeiro 


7 A estatistica teste e freqiientemente representada por 
Xp, mas o guia de estilos oficial da American Psycholo¬ 
gy Association (APA) nao reconhece esse termo. 


mes da dieta para o segundo mes, T = 26, 
r = —0,03. Podemos concluir que a dieta 
Andikins, assim como o seu criador, e um 
completo fracasso. 

13.6 0 QUE DESC0BRIM0S S0BRE 
ESTATISTICA? ® 

Testes como otea ANOVA sao robustos a 
violacao de suas hipoteses, e correcoes podem 
ser feitas para assegurar que esses testes para- 
metricos sejam precisos quando as suposigoes 
sao violadas. Este capitulo apresentou aborda- 
gens alternativas para a violagao das hipoteses 
parametrica, que consiste em utilizar testes 
tendo como base postos em vez dos dados 
reais mensurados. Comegamos vendo o teste 
da soma dos postos de Wilcoxon e o teste de 
Mann-Whitney, utilizados para comparar dois 
grupos independentes. Os testes nos possibi- 
litaram verificar alguns detalhes do processo 
de trabalhar com postos. A seguir, verificamos 
o teste dos postos com sinais de Wilcoxon, 
utilizado para comparar duas condigoes rela- 
cionadas. Examinamos situagoes complexas 
que envolvem mais de duas condigoes ou gru¬ 
pos (o teste para condigoes independentes de 
Kruskal-Wallis e a ANOVA de Friedman para 
condigoes ou grupos relacionados). Para cada 
um desses testes, focamos na teoria do teste 


( - ; - 

Dica da Samanta Ferrinho 





V. 


• A ANOVA de Friedman compara varias condigoes quando as mesmas pes- 
soas participam em cada condigao e os dados resultantes nao sao normal- 
mente distribuidos ou violam a hipotese da ANOVA de medidas repetidas 
de um fator. 

• Observe a linha Sig. Assint. ( Asymp. Sig.): se o valor for menor do que 0,05, 
os grupos sao significativamente diferentes. 

• Voce pode realizar um acompanhamento da analise principal com testes de 
postos com sinais de Wilcoxon, mas so devera aceita-los como significativos 
se eles tiverem uma significancia inferior a 0,05/numero de testes. 

• Relate a estatistica x 2 , os graus de liberdade e o valor da significancia para 
a analise principal. Para qualquer teste post hoc, relate a estatistica T e um 
tamanho de efeito se possivel (voce pode ainda apresentar o valor de z cor- 
respondente e o valor da significancia). Relate ainda as medianas e suas am¬ 
plitudes correspondentes (ou faga um diagrama de caixa e bigodes). 
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(embora essa segao possa ser pulada) e depois 
detalhamos como conduzi-los com o auxi- 
lio do SPSS, como interpretar os resultados 
e como relatar os resultados de cada um dos 
testes apresentados. Nesse processo, descobri- 
mos que drogas lhe deixam deprimido, que a 
soja reduz a contagem de espermatozoides e 
que o meu estilo de vida nao leva a perda de 
peso! Isso conclui nosso estudo sobre a com- 
paragao de grupos. A ultima segao final do li- 
vro aborda alguns conteudos pesados. Hora de 
parar e tomar um drinque. 


13.7 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• Q de Cochran 

• ANOVA de Friedman 

• Teste de Jonkheere-Terpstra 

• W de Kendall 

• Z de Kolmogorov-Smirnov 

• Teste de Kruskal-Wallis 

• Teste de Mann-Whitney 

• Teste de McNemar 

• Teste da Mediana 

• Metodo de Monte Carlo 

• Reagoes extremas de Moses 

• Testes nao-parametricos 

• Postos 

• Testes dos Sinais 

• Corrida de Wald-Wolfowitz 

• Teste da soma dos postos de Wilcoxon 

• Teste dos postos com sinais de Wilcoxon 


13.8 TAREFAS DO ALEX ESPERTO 



Tarefa 1: Uma psicologa esta- 
va interessada em verificar di- 
ferengas entre especies de ho- 
mens e cachorros. Ela observou 
um grupo de caes e outro grupo 
de homens em uma situagao natural (20 de 
cada). Ela classificou varios comportamen- 
tos como sendo tipo-cao (urinar em arvo- 
res e postes, tentar copular com qualquer 
coisa que se mova e tentar lamber os pro- 
prios genitais). Para cada homem e cachor- 
ro, ela contou o numero de comportamen- 


tos tipo-cao observado num perfodo de 24 
horas. Ela apresentou a hipotese que os ca¬ 
chorros apresentam mais comportamentos 
do tipo-cao do que os homens. Os dados 
estao no arquivo MenLikeDogs.sav. Ana- 
lise esses dados com um teste de Mann- 
-Whitney. © 

• Tarefa 2: Muita especulagao ja foi feita 
sobre a influencia de mensagens sublimi- 
nares em discos. Por exemplo, tanto Ozzy 
Osbourne quanto Judas Priest foram acu- 
sados de colocar mensagens subliminares 
nos seus discos que influenciam adolescen- 
tes a fazer coisas como estourar a propria 
cabega com uma arma. Um psicologo esta 
interessado em verificar se esse tipo de 
mensagem, de fato, tem algum efeito. Ele 
pegou a fita original da musica “ Baby one 
more time ” (Amor mais uma vez) da Brit¬ 
ney Spears e criou uma segunda versao que 
com a mensagem subliminar “deliver your 
soul to the dark lord" (entregue sua alma 
para o capeta ) repetida no coro. Ele pegou 
essa versao e a original e tocou uma versao, 
ao acaso, para um grupo de 32 pessoas. Ele 
pegou o mesmo grupo seis meses depois 
e tocou a versao que a pessoa nao tinha 
ouvido anteriormente. Assim cada pessoa 
ouviu tanto a versao original quanto a ver¬ 
sao com a mensagem subliminar, mas em 
momentos diferentes. O psicologo depois 
contou o numero de bodes sacrificados na 
semana seguinte apos cada versao ter sido 
ouvidas. Ele levantou a hipotese de que a 
mensagem subliminar levaria ao sacrifrcio 
de mais bodes. Os dados estao no arquivo 
DarkLord.sav; analise esses dados com o 
teste de postos com sinais de Wilcoxon. © 

• Tarefa 3: Uma psicologa esta interes¬ 
sada no efeito dos programas televisivos 
na vida domestica. Ela langou a hipotese 
que por meio de “aprender vendo”, certos 
programas podem incentivar as pessoas a 
se comportarem como os personagens do 
programa. Isso, por sua vez, pode afetar 
o relacionamento do telespectador (de- 
pendendo se o programa mostra relacio- 
namentos harmoniosos ou conflituosos). 
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Ela pegou episodios de tres programas de 
TV populares e os mostrou a 54 casais. 
Depois, cada casal foi deixado sozinho em 
uma sala por uma hora. O pesquisador me- 
diu o numero de vezes que o casal discutiu. 
Cada casal viu todos os tres programas de 
TV em tempos diferentes (com uma sema- 
na de intervalo) e a ordem em que os pro¬ 
gramas foram vistos foi contrabalangada 
entre os casais. Os programas de TV sele- 
cionados foram EastEnders* (que retrata 
as vidas de pessoas extremamente misera- 
veis, briguentas, que nao gostam de nada 
alem de bater um no outro, mentir um para 
o outro, dormir com as mulheres uns dos 
outros e nao mostrar consideragao alguma 
pelos demais seres humanos!). Friends** 
(que retrata um grupo nao-realista de pes¬ 
soas simpaticas e boas que se amam) e um 
programa da National Geographic sobre 
baleias (esse deve agir como controle). Os 
dados entao no arquivo Eastenders.sav; 
acesse o arquivo e realize uma ANOVA de 
Friedman. © 

• Tarefa 4: Uma pesquisadora esta inte- 
ressada em tentar prevenir a coulrofobia 
(medo de palhagos) em criangas. Ela de- 
cidiu realizar um experimento no qual di¬ 
ferentes grupos de criangas (15 em cada) 
foram expostas a diferentes formas de 
informagoes positivas sobre palhagos. O 
primeiro grupo assistiu a algumas propa¬ 
gandas do McDonald's em que Ronald 
McDonald e visto pulando com criangas e 


* N. de T.: Serie britanica, parecida com uma novela, po¬ 
pular e premiada que come§ou em 1985 no canal BBC1. 

**N. de T.: Seriado americano transmitido pela rede 
NBC entre 1994 e 2004. Conta a vida de seis amigos 
que moram em Nova York. 


dizendo que eles devem amar suas maes. 
A um segundo grupo foi contada uma 
historia sobre um palhago que ajudou 
algumas criangas que tinham se perdido 
na floresta (que diabos um palhago fazia 
na floresta e um misterio). Um terceiro 
grupo foi entretido por um palhago real 
que veio ate a sala de aula e fez animais 
com baloes para as criangas. 8 Um grupo 
final foi deixado como controle e a eles 
nada foi oferecido. A pesquisadora fez 
uma escala propria da medida de quanto 
as criangas gostam de palhagos resultando 
em um escore que varia de 0 (sem qual- 
quer medo de palhagos) ate 5 (com muito 
medo de palhagos). Os dados estao no ar¬ 
quivo coulrophobia.sav; acesse os dados 
e realize um teste de Kruskal-Wallis. © 

As respostas para as questoes estao no ar¬ 
quivo Answers(Chapterl3).pdf. Como esses 
exemplos sao do livro de Field e Hole (2003), 
voce pode copiar o Capftulo 7 dessa obra para 
obter algumas respostas detalhadas. 

13.9 LEITURAS COMPLEMENTARES 

Siegel, S & Castellan, N. J. Nonparametric 
statistics for the behavioral sciences (2 nd 
edition). New York: McGraw-Hill. Texto 
definitivo sobre estatistica nao-parametrica. 
Talvez nao seja um bom livro para os que 
tern fobia a estatistica, mas se voce foi bem- 
-sucedido neste capftulo, esse livro e um 
proximo passo excelente. 


Infelizmente, na primeira tentativa que o estudo foi 
feito o palhago acidentalmente estourou um balao. 0 
barulho assustou as criancas e elas associaram o medo 
ao palhaco. Todas as 15 criancas estao hoje fazendo te- 
rapia para a coulrofobia. 





14 

ANALISE DE VARIANCIA 
MULTIVARIADA (MANOVA) 


14.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? @ 

Nos ultimos cinco 
MANOVA? J capftulos, vimos como 
o Modelo Linear Ge- 
ral (MLG) pode ser 
utilizado para detectar 
diferengas entre grupos 
em uma iinica variavel 
dependente. Contudo, 
existem muitas circunstancias em que estamos 
interessados em diversas variaveis dependentes 
e, nesses casos, o modelo simples da ANOVA 
nao e adequado. Em vez dele, podemos utilizar 
uma extensao dessa tecnica conhecida como 
Analise de Variancia Multivariada (ou MANO¬ 
VA). A MANOVA pode ser pensada como uma 
ANOVA para situacoes em que existem diver¬ 
sas variaveis dependentes. Os principios da 
ANOVA sao estendidos a MANOVA no senti- 
do de que podemos utilizar a MANOVA quan- 
do existe apenas uma variavel independente 
ou quando existem varias, podemos olhar as 
interagoes entre variaveis independentes e po¬ 
demos ainda realizar contrastes para ver quais 
grupos diferem entre si. A ANOVA pode ser 
utilizada somente em situagoes em que exis¬ 
te uma unica variavel dependente (ou safda). 


por isso e conhecida como um teste univariado 
(univariado significa “uma variavel”). A MA¬ 
NOVA trabalha com diversas varaveis depen¬ 
dentes (ou safdas) simultaneamente e, portan- 
to, e um teste multivariado (multivariado quer 
dizer “muitas variaveis”). Este capftulo ira ex- 
plicar o basico sobre a MANOVA, para aque- 
les que querem pular a teoria e ir direto para 
a pratica. Mas para quem quiser saber mais, 
existe uma extensa segao teorica que explica 
como a tecnica funciona. Depois, veremos um 
exemplo utilizando o SPSS e aprenderemos 
como as safdas do teste podem ser interpreta- 
das. Isso vai nos levar a outro teste estatistico, 
conhecido como Analise Discriminante. 

14.2 INTRODUQAO: SEMELHANQAS E 
DIFERENCAS COM A ANOVA (D 

Se tivermos coletado dados sobre diversas 
variaveis dependentes, podemos simplesmen- 
te realizar uma ANOVA para cada variavel 
dependente (e se voce le artigos de pesquisa, 
vera que os pesquisadores fazem isso com fre- 
quencia!). No Capftulo 8, uma questao seme- 
lhante foi apresentada sobre o uso da ANOVA 
em vez de multiplos testes t. A resposta de por 
que a MANOVA e utilizada em vez de varias 
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ANOVAs e a mesma: quanto mais testes rea- 
lizarmos sobre os mesmos dados, mais estare- 
mos inflacionando a taxa de erro de conjunto 
(veja a Se£ao 8.2.1). Quanto mais variaveis 
dependentes forem mensuradas, mais testes 
ANOVA serao necessarios e maior sera a pro- 
babilidade de cometermos um erro do Tipo I. 

Entretanto, exis- 
tem outros motivos 
para preferirmos a 
MANOVA em vez 
de varios testes ANO¬ 
VA. Existem infor- 
magSes adicionais 
importantes que sao 
obtidas da MANOVA. Se ANOVAs separadas 
forem realizadas para cada variavel dependente, 
qualquer relacionamento entre todas as varia¬ 
veis sera ignorado. Desse modo, perdemos in- 
formagoes sobre as correlates que podem 
existir entre as variaveis dependentes. A MA¬ 
NOVA, ao incluir todas as variaveis dependen¬ 
tes na mesma analise, leva em conta o relacio¬ 
namento entre as variaveis de salda. Relacionado 
a essa questao, a ANOVA pode nos informar se 
os grupos diferem ao longo de uma unica di- 
mensao enquanto a MANOVA tern o poder de 
detectar se os grupos diferem ao longo de uma 
combinacao de dimensoes. Por exemplo, a 
ANOVA nos informa como os escores de uma 
unica variavel dependente distinguem grupos 
de participantes (por exemplo, podemos distin- 
guir motoristas, nao motoristas e motoristas be- 
bados pelo numero de pedestres que eles mata- 
ram). A MANOVA incorpora int’ormacbes 
sobre varias medidas de salda e, dessa forma, 
nos informa se os grupos de participantes po¬ 
dem ser distinguidos por uma combinacao de 
escores em varias medidas dependentes. Por 
exemplo, pode nao ser posslvel distinguir moto¬ 
ristas, nao motoristas e motoristas bebados so- 
mente pelo numero de pedestres que eles mata- 
ram, mas eles podem ser distinguidos por uma 
combinacao do numero de pedestres que mata- 
ram, o numero de postes que eles derrubaram e 
o numero de carros em que eles bateram. Nesse 
sentido, a MANOVA tern um poder maior de 
detectar um efeito, porque ela pode detectar se 


os grupos diferem ao longo de uma combinacao 
de variaveis, enquanto a ANOVA pode detectar 
somente diferencas entre grupos com base em 
uma unica variavel (veja Huberty e Morris, 
1989 e a Segao 14.2.2). Por essas razoes, e pre- 
ferlvel realizar uma MANOVA do que varios 
testes ANOVA. 

14.2.1 Advertencia © 

Pela minha descricao, a MANOVA parece 
um teste rotineiro que permite medir centenas 
de variaveis dependentes e depois joga-las na 
analise. Mas as coisas nao sao bem assim. Nao 
e recomendavel amontoar todas as variaveis 
dependentes juntas em uma MANOVA a me- 
nos que voce tenha uma boa base teorica ou 
emplrica para faze-lo. Mencionei no corneco 
do livro que os procedimentos estatlsticos sao 
apenas uma forma de triturar numeros; assim, 
mesmo que voce coloque lixo na analise, ainda 
sera posslvel obter conclusoes estatisticamen- 
te significativas, mas que empiricamente nao 
tern sentido. Em circunstancias em que exis- 
te uma boa base teorica para incluir algumas, 
mas nao todas, de suas variaveis dependentes, 
voce deve executar analises separadas: uma 
para as variaveis sendo testadas de uma forma 
heurlstica e uma para as variaveis que sejam 
teoricamente significativas. O importante e 
nao incluir montes de variaveis na MANOVA 
so porque elas foram coletadas. 

14.2.2 Controversies © 

Da mesma forma que a ANOVA, a MA¬ 
NOVA e um teste de dois estagios em que um 
teste global e executado primeiro, seguido por 
testes mais especlficos, aplicados para des- 
cobrir diferen^as entre grupos. Infelizmente, 
existem controversias sobre os dois estagios 
do procedimento MANOVA. Para a analise 
principal, existem quatro formas comumente 
utilizadas de avaliar a significance global de 
uma MANOVA, e os debates giram em torno 
de qual dos metodos e o melhor considerando 
o poder e o tamanho da amostra. Alem disso, 
existe um debate sobre a melhor forma de ana- 
lisar e interpretar as diferenijas entre os grupos 
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quando a MANOVA global e significativa. 
Existem duas abordagens principals para fazer 
a analise: a ANOVAs univariadas e a analise 
discriminante. Considerarei ambas. 

Outra controversia esta relacionada ao 
poder da MANOVA (isto e, a habilidade da 
MANOVA de detectar um efeito que de fato 
existe). Mencionei nas segoes anteriores que a 
MANOVA tem mais poder que uma ANOVA 
para detectar efeitos porque ela pode levar em 
consideracao as correlagoes entre as variaveis 
dependentes. Entretanto, a questao do poder e 
mais complexa que isso. Ramsey (1982) des- 
cobriu que a medida que as correlates entre 
as variaveis dependentes aumentam, o poder 
da MANOVA diminui. Isso levou Tabachnick 
e Fidell (2001) a afirmar que a MANOVA 
“apresenta melhores resultados com variaveis 
dependentes altamente correlacionadas de 
forma negativa e resultados aceitaveis quando 
as variaveis dependentes sao moderadamente 
correlacionadas em qualquer diregao, e que a 
MANOVA e uma perda de tempo quando as 
variaveis dependentes nao sao correlaciona¬ 
das” (p. 357). Em contraste, Stevens (1980), 
investigando o efeito das correlates das va¬ 
riaveis dependentes no poder do teste, revelou 
que “o poder com altas intercorrelates e, em 
muitos casos, maior do que com intercorre¬ 
lates moderadas e, em alguns casos, muito 
maior” (p. 736). Esses achados sao contradi- 
torios, o que nos deixa com a seguinte duvida: 
qual e, exatamente, o relacionamento entre 
o poder e as intercorrelagoes das variaveis 
dependentes? Felizmente, Cole e colabora- 
dores (1994) explicam muito bem esse rela¬ 
cionamento. Eles descobriram que o poder da 
MANOVA esta associado a uma combinacao 
das correlacoes entre variaveis e o tamanho 
de efeito. Resumindo, se voce espera encon- 
trar um grande efeito, entao a MANOVA tera 
um grande poder se as medidas sao de alguma 
forma diferentes (mesmo que negativamente 
correlacionadas) e se as diferengas entre os 
grupos estao na mesma direcao para cada me¬ 
dida. Se voce tiver duas variaveis dependentes, 
uma exibindo uma grande diferenca de grupo 
e outra com uma pequena ou sem diferenca 


de grupo, entao o poder aumentara se essas 
variaveis estiverem altamente correlaciona¬ 
das. O que o trabalho de Cole e colaboradores 
nos diz e que se voce esta interessado em quao 
poderosa a MANOVA podera ser, deve consi- 
derar nao apenas as intercorrelacdes entre as 
variaveis dependentes mas tambem o tama¬ 
nho e o padrao das diferetinas entre os grupos 
que voce espera obter. Contudo, lembre-se de 
que o trabalho de Cole e colaboradores esta 
limitado a comparagbes entre dois grupos; as 
consideragoes sobre o poder do teste sao mais 
complexas em situagoes de grupos multiplos. 

14.2.3 0 exemplo do capitulo © 

Ao longo deste capitulo, utilizaremos um 
unico exemplo para ilustrar como a MANOVA 
funciona e como realiza-la no SPSS. Imagine 
que estamos interessados nos efeitos da TCC 
(Terapia Cognitivo-Comportamental) sobre o 
TOC (Transtorno Obsessivo-Compulsivo). O 
TOC e uma doenga caracterizada por ideias 
ou comportamentos que o proprio doente acha 
detestaveis (no meu caso, e o pensamento de 
alguem executando um teste t em dados que 
nao sao normalmente distribufdos ou a ideia 
da morte dos pais). Isso leva o doente a exe- 
cutar atividades para neutralizar esses pensa- 
mentos desagradaveis (essas atividades podem 
ser mentais, como executar uma MANOVA na 
minha cabeca para me fazer sentir melhor so¬ 
bre o pensamento do teste t, ou ffsico, como 
tocar o chao 23 vezes para que os pais nao 
morram). Podemos comparar um grupo de 
pacientes com TOC apos o tratamento com 
TCC e apos uma TC (Terapia Comportamen- 
tal) com um grupo de pacientes com TOC que 
ainda estao esperando por tratamento (uma 
condigao de ST - Sem Tratamento). 1 Muitas 
psicopatologias tem tanto elementos compor- 


1 A TC (Terapia Comportamental) e baseada na ideia de 
que se voce parar os comportamentos mal-adaptados a 
desordem desaparecera, enquanto a TCC (Terapia Cog- 
nitiva Comportamental) e baseada na ideia de .que tratar 
as cogni§oes mal-adaptadas eliminara o transtorno. Se 
voce quiser saber mais sobre o assunto, recomendo meu 
livro sobre psicologia clrnica (Field, 2003), que esta dis- 
pomvel nas segoes de “encalhados” de qualquer livraria. 




Descobrindo a Estatistica Usaimdo o SPSS 517 


tamentais quanto cognitivos. Por exemplo, no 
TOC, se alguem tem uma obsessao por conta¬ 
in! nacao por germes, esse transtorno pode se 
manifestar como uma lavagem de maos obses- 
siva e ira influenciar nao apenas quantas vezes 
a pessoa ira lavar as maos (comportamento), 
mas tambem o numero de vezes que ela pensa 
em lavar as maos (cognigao). Da mesma for¬ 
ma, alguem obcecado por bolsas nao apenas 
ira pensar muito sobre elas, mas tambem apre- 
sentar comportamentos relacionados (como 
dizer “bolsa” varias vezes ou comprar qual- 
quer bolsa que ver pela frente). Se voce estiver 
interessado em verificar quao bem-sucedida e 
a terapia, nao e suficiente observar apenas ex- 
pressoes do comportamento (como se o com¬ 
portamento obsessivo foi reduzido); tambem 
e importante determinar se as cognicoes es- 
tao sendo alteradas. Por isso, nesse exemplo, 
duas variaveis dependentes foram avaliadas: 
a ocorrencia de comportamentos obsessivos 
(actions) e a ocorrencia de obsessoes cogni- 
tivas (thoughts). Essas variaveis dependentes 
foram mensuradas em um unico dia e, assim, 


representam o numero de pensamentos/com- 
portamentos obsessivos em um dia normal. 

Os dados estao na Tabela 14.1 e podem ser 
encontrados no arquivo OCD.sav.* Os partici- 
pantes pertencem a um dos seguintes grupos: 
um (TCC), dois (TC) ou tres (ST), e dentro dos 
grupos todos os participantes tiveram tanto as 
agoes quanto os pensamentos mensurados. 


14.3 TEORIA DA MANOVA 


E complexo entender a 
teoria da MANOVA sem um 
bom conhecimento de algebra 
matricial, mas a algebra matri- 
cial esta alem do escopo deste 
livro (os interessados podem consultar Nam- 
boodiri, 1984; ou Stevens, 1992). Contudo, 
vou apresentar as bases conceituais da MA- 



N. de T.: Se o arquivo OCD.sav for utilizado, os gru¬ 
pos e termos acima mencionados aparecerao em Ingles. 
Nesse caso, OCD ( Obsessive compulsive disorder ), 
CBT ( Cognitive Behaviour Therapy ), BT ( Behaviour 
Therapy ) e NT {No-Treatment). 


Tabela 14.1 Dados do arquivo OCD.sav 


Grupo 


VD 1: Acoes 



VD 2: Pensamentos 

TCC (1) 

TC (2) 

ST (3) 

TCC (1) TC (2) 

ST (3) 


5 

4 

4 

14 

14 

13 


5 

4 

5 

11 

15 

15 


4 

1 

5 

16 

13 

14 


4 

1 

4 

13 

14 

14 


5 

4 

6 

12 

15 

13 


3 

6 

4 

14 

19 

20 


7 

5 

7 

12 

13 

13 


6 

5 

4 

15 

18 

16 


6 

2 

6 

16 

14 

14 


4 

5 

5 

11 

17 

18 

X 

4,90 

3,70 

5,00 

13,40 

15,20 

15,00 

s 

1,20 

1,77 

1,05 

1,90 

2,10 

2,36 

s 2 

1,43 

3,12 

1,11 

3,60 

4,40 

5,56 



^Geral(Agoes) 4,53 



y 

'' Geral(Pensamentos) 

: 14,53 



^Geral(Agoes) 2,1195 



C 2 _ 

Geral(Pensamentos) 

4,8780 


(*) VD = Variavel Dependente 
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NOVA utilizando matrizes, sem exigir que 
voce entenda exatamente como essas matrizes 
sao utilizadas. Quem estiver interessado na 
teoria exata por tras da MANOVA deve ler 
Bray e Maxwell (1985), que e um otimo texto 
sobre o assunto. 


14.3.1 Introdugao as matrizes © 

Primeiro, preciso explicar o que e uma ma- 
triz: uma matriz e simplesmente uma colecao 
de numeros arranjados em colunas e linhas. De 
fato, elas foram utilizadas ao longo deste livro 
sem que voces se dessem conta: o editor de 
dados do SPSS. No editor de dados do SPSS, 
temos numeros arranjados em colunas e linhas 
e isso e exatamente o que e uma matriz. Uma 
matriz pode ter muitas colunas e linhas, e ge- 
ralmente especificamos as dimcnsoes de uma 
matriz utilizando numeros. Assim, uma matriz 
2 x 3 e um arranjo de numeros com duas li- 
nhas e tres colunas, e uma matriz 5 x 4 e uma 
com 5 linhas e 4 colunas. Por exemplo: 

4 6 8' 

4 6 7 
3 5 8 

5 7 9 

6 6 9, 

matriz 2x3 matriz 5x4 

Voce pode pensar nessas matrizes em 
termos de cada linha representando os dados 
de um unico participante e cada coluna como 
sendo os dados de uma determinada variavel. 
Assim, para uma matriz 5x4 podemos ima- 
ginar uma situagao onde cinco participantes 
foram testados em quatro variaveis: desse 
modo, o primeiro participante teve um escore 
de 2 na primeira variavel e 8 na quarta varia¬ 
vel. Os valores no interior de uma matriz sao 
referidos como componentes ou elementos. 

Em uma matriz quadrada, o numero de 
linhas e igual ao numero de colunas. Nesse 
tipo de matriz e, as vezes, util distinguir os 
componentes da diagonal (isto e, os valores 
que estao na linha diagonal a partir do elemen- 
to do canto superior esquerdo ao componente 
do canto inferior direito) dos componentes 


2 5 6 

3 5 8 


fora da diagonal (valores que nao estao na 
diagonal). Na matriz abaixo, os elementos da 
diagonal sao 5,12, 2 e 6, porque eles estao na 
linha diagonal. Os componentes fora da dia¬ 
gonal sao todos os demais. Uma matriz qua¬ 
drada na qual os elementos da diagonal sao 
iguais a 1 e os fora da diagonal sao iguais a 0 e 
conhecida como matriz identidade. 

/I 0 0 
0 10 
\0 0 1 

matriz quadrada matriz identidade 



Espero que o conceito de matriz seja ago¬ 
ra menos amedrontador do que parecia no 
comeco: ela nao e uma entidade matematica 
magica, apenas uma maneira de representar 
um conjunto de dados - da mesma forma que 
uma planilha. 

Existe um caso especial de uma matriz em 
que temos dados de somente uma pessoa; isso 
e conhecido como uma matriz linha ou vetor 
linha. Da mesma forma, se existe apenas uma 
coluna em uma matriz, temos um vetor coluna. 
Nos exemplos abaixo, o vetor linha pode ser 
pensado como os dados de uma unica pessoa 
em quatro variaveis diferentes, e o vetor coluna 
pode ser pensado como os dados de cinco par¬ 
ticipantes avaliados em uma unica variavel: 


(2 6 4 8) 
vetor linha 


8 

6 

10 

15 

, 6 , 

vetor coluna 


Com esse novo conhecimento sobre vetores, 
agora podemos dar uma breve olhada em como 
eles sao utilizados para realizar a MANOVA. 


14.3.2 Algumas matrizes importantes e 
suas fmicoes © 

Assim como na ANOVA, estamos pri- 
meiramente interessados em quanta variancia 
pode ser explicada pela manipulagao experi- 
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mental (que em termos reais significa quanta 
variancia e explicada pelo fato de que certos 
escores aparecem em certos grupos). Portan- 
to, precisamos saber a soma dos quadrados 
devido a variavel de agrupamento (a varia- 
gao sistematica, SS M ), a soma dos quadrados 
devido a difcrencas naturais entre os partici- 
pantes (a variagao residual, SS R ) e, e claro, a 
quantidade total de variagao precisa ser ex¬ 
plicada (SS T ). (Para mais detalhes sobre essas 
fontes de variagao, releia os Capitulos 5 e 8.) 
Contudo, mencionei que a MANOVA tam- 
bem leva em conta diversas variaveis depen- 
dentes simultaneamente, e faz isso utilizando 
uma matriz que contem informagoes sobre as 
variancias de responsabilidade de cada varia¬ 
vel dependente. 

Para o teste F univariado (por exemplo, 
a ANOVA), calculamos a razao da variancia 
sistematica pela nao-sistematica para uma 
unica variavel dependente. Na MANOVA, a 
estatistica teste e derivada comparando a ra¬ 
zao das variancias sistematicas pelas nao-sis- 
tematicas para diversas variaveis dependentes. 
Essa comparagao e feita utilizando a razao de 
uma matriz representando as variancias sis¬ 
tematicas de todas as variaveis dependentes 
para uma matriz representando as variancias 
nao-sistematicas de todas as variaveis depen¬ 
dentes. A matriz que representa as variancias 
sistematicas (ou a soma dos quadrados do mo- 
delo para todas as variaveis) e representada 
pela letra H e e denominada hipotese de ma¬ 
triz produto cruzado e soma dos quadrados 
(ou hipotese SSCP). A matriz que represen¬ 
ta a variancia nao-sistematica (a soma dos 
quadrados residual para todas as variaveis) 
e representada pela letra E, e e denominada 
matriz produto cruzado e erro da soma 
dos quadrados (ou erro SSCP). Finalmente, 
existe uma matriz que representa a quantidade 
total de variancia presente para cada variavel 
dependente (a soma dos quadrados total para 
cada variavel dependente), representada por T 
e denominada matriz dos produtos cruzados e 
soma dos quadrados total (ou total SSCP). 

Mais tarde, mostrarei que essas matrizes 
sao usadas exatamente da mesma forma que as 


simples somas dos quadrados (SS M , SS R e SS X ) 
na ANOVA para derivar a estatistica represen¬ 
tando a razao das variancias sistematicas para 
as nao-sistematicas no modelo. Alguns de 
voces devem ter notado que as matrizes que 
descrevi sao todas denominadas matrizes so¬ 
mas dos quadrados e produto cruzado (SSCP). 
Deve ser obvio o motivo de essas matrizes 
serem chamadas de soma dos quadrados, mas 
por que existe uma referenda ao produto cru¬ 
zado nos seus nomes? Aprendemos um pouco 
sobre desvios produto cruzado no Capitulo 4 e 
vimos que eles representavam o valor total do 
erro combinado entre duas variaveis (assim, 
de certa forma eles representavam uma esti- 
mativa padronizada da correlacao total entre 
duas variaveis). Enquanto a soma dos quadra¬ 
dos de uma variavel e a soma dos quadrados 
das diferengas entre os valores observados e 
a media dessa variavel, o produto cruzado e 
o erro total combinado entre duas variaveis. 
Mencionei antes que a MANOVA tem o poder 
de levar em conta qualquer correlacao entre as 
variaveis dependentes; ela faz isso utilizando 
esses produtos cruzados. 

14.3.3 Calculando a MANOVA 

manualmente: um exemplo (D 

Para comegar, vamos executar ANOVAs 
univariadas em cada uma das duas variaveis de¬ 
pendentes no nosso exemplo TOC (veja a Tabe- 
la 14.1). Uma descrigao do modelo da ANOVA 
pode ser encontrada no Capitulo 8 - eu vou me 
basear na hipotese de que voce tenha lido esse 
capitulo, portanto, se voce ainda nao entendeu 
os detalhes do Capitulo 8 agora e uma boa hora 
para (re)ler as Segoes 8.2.4 a 8.2.8. 

14.3.3.1 ANOVA univariada para VD 1 
(Agoes) © 

Existem tres somas de quadrados que pre- 
cisam ser calculadas. Primeiro, precisamos 
avaliar quanta variabilidade existe dentro dos 
dados (SS X ) a ser explicada, depois precisa¬ 
mos ver quanto dessa variabilidade pode ser 
explicado pelo modelo (SS M ) e, finalmente, 
avaliar quanto erro existe no nosso modelo 
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(SS R ). No Capftulo 8, calculamos cada um 
desses valores: 

• SS T(A?aes) : A soma total dos quadrados e 
obtida calculando as diferengas entre cada 
um dos 20 escores e a media desses es- 
cores, entao elevando ao quadrado essas 
diferengas e somando todos os quadrados 
obtidos. Alternativamente, voce pode dei- 
xar que o SPSS calcule a variancia para 
os dados da agao (action) (sem levar em 
conta o grupo a que pertencem) e entao 
multiplicar esse valor pelo numero de es¬ 
cores menos 1: 

SS X = *Geral( W — 1) 

= 2,1195(30 - 1) 

= 2,1195 x 29 
= 61,47 

• SS M(A?6es) : Esse valor e calculado tomando as 
diferengas das medias de cada grupo em rela- 
gao a media geral e entao elevando essas di¬ 
ferengas ao quadrado. Depois, esses valores 
sao multiplicados pelo numero de escores do 
grupo e entao os resultados sao somados: 

SS T = 10(4,90 - 4,53) 2 + 10(3,70 - 
4,53) 2 + 10(5,00 - 4,53) 2 

= 10(0,37) 2 + 10(—0,83) 2 -I-10(0,47) 2 
= 1,37 + 6,89 + 2,21 
= 10,47 

• SS R(A?5es) : Esse valor e calculado tomando 
as diferengas entre cada escore e a media 
do grupo a qual o escore pertence. Essas 
diferengas sao entao elevadas ao quadra¬ 
do e somadas entre si. Alternativamente, 
voce pode solicitar que o SPSS calcule a 
variancia dentro de cada grupo, multipli- 
que a variancia de cada grupo pelo nume¬ 
ro de escores menos um e entao some os 
resultados entre si: 

SS R = StccC^tcc — 1) 4" s TC (ji TC — 1) 

+ s ST (n ST — 1) 

= (1,433)(10 - 1) + (3,122)(10 - 1) 

+ ( 1 , 111 )( 10 - 1 ) 


= (1,433 x 9) + (3,122 x 9) 

+ (1,111 x 9) 

= 12,9 + 28,1 + 10,0 
= 51,0 

O proximo passo e calcular a media das 
somas dos quadrados (o quadrado medio) divi- 
dindo o resultado obtido pelo numero de graus 
de liberdade correspondente (Segao 8.2.7): 


ss 

gi 

MS 

SS|y/|(Agoes) = 10,47 

2 

5,235 

^^R(Agoes) = 51,00 

27 

1,889 


O ultimo estagio e calcular F pela divisao 
do quadrado medio do modelo pela media dos 
quadrados do erro do modelo: 

„ MS m 5,235 0 „_. 

F =-=-= 2,771 

MS r 1,889 

Esse valor pode entao ser confrontado 
com o valor crftico da F. Voce deve observar 
aqui o calculo das varias somas dos quadrados 
e com que cada uma se relaciona. 

14.3.3.2 AIMOVA univariada para VD 2 
(pensamentos) © 

Os calculos aqui sao realizados da mesma 
forma como ocorreram com a variavel depen- 
dente(VD) 1. 

S S|(p t . nsanu . ntos) . 

SS X = Soeral( n — 1) 

= 4,878(30- 1) 

= 4,878 x 29 
= 141,46 

sc 

^ ^MUPensamentos) • 

SS M = 10(13,40 - 14,53) 2 + 10(15,20 
- 14,53) 2 + 10(15,00 14,53) 2 

= 10(—1,13) 2 + 10(0,67) 2 + 10(0,47) 2 
= 12,77 + 4,49 + 2,21 
= 19,47 
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SST(Pensamentos)‘ 

SS R = StCc( w TCC — 1) + s Tc( n TC ~ 1) 

+ 5 st (« st — 1) 

= 3,6(10- 1) + 4,4(10- 1) 

+ 5,56(10- 1) 

= (3,6 x 9) + (4,4 x 9) 

+ (5,56 x 9) 

= 32,4 + 39,6 + 50,0 

= 122,0 

O proximo passo e calcular a media das 
somas dos quadrados (o quadrado medio) divi- 
dindo o resultado obtido pelo numero de graus 
de liberdade correspondente (Segao 8.2.7): 


ss 

gl 

MS 

^^M(Thoughts) = 19-47 

2 

9,735 

SS R(ThoughtS ) = 122,00 

27 

4,519 


O ultimo estagio e calcular F pela divisao 
do quadrado medio do modelo pela media dos 
quadrados do erro do modelo: 


MS m 

MSr 


9,735 

4,519 


2,154 


Esse valor pode entao ser confrontado com 
o valor crftico da F. Novamente, o que deve ser 
notado aqui e o calculo das varias somas dos 
quadrados e com o que cada uma se relaciona. 


14.3.3.3 0 relacionamento entre VDs: 
produtos cruzados © 

Ja sabemos que a MANOVA utiliza a 
soma dos quadrados como uma ANOVA e na 
proxima segao, veremos exatamente como 
ela usa esses valores. Contudo, tambem men- 
cionei que a MANOVA leva em conta o rela¬ 
cionamento entre as variaveis dependentes e 
que ela faz isso utilizando o produto cruzado. 
Para ser preciso, existem tres produtos cruza¬ 
dos diferentes que sao de interesse e esses tres 
produtos cruzados se relacionam com as tres 
somas dos quadrados que calculamos para as 
ANOVAs univariadas: isto e, existe o produ¬ 


to cruzado total, o produto cruzado devido ao 
modelo e o produto cruzado dos reslduos. Va- 
mos dar uma olhada no produto cruzado total 
(CP T ) primeiro. 

Mencionei no Capitulo 4 que o produto 
cruzado e a difcrenca entre os escores e a me¬ 
dia em um grupo multiplicado pela diferenga 
entre os escores e a media de outro grupo. No 
caso do produto cruzado total, a media de in¬ 
teresse e a media geral de cada variavel depen- 
dente (veja aTabela 14.2). Consequentemente, 
podemos adaptar a equacao do produto cruza¬ 
do descrita no Capitulo 4 utilizando as duas 
variaveis dependentes. A equagao resultante 
para o produto cruzado total esta apresentada 
na equagao (14.1). Portanto, para cada variavel 
dependente, tomamos cada escore e subtraimos 
a media da variavel. Isso deixa voce com dois 
valores por participante (um para cada variavel 
dependente) que devem ser multiplicados entre 
si para obter o produto cruzado de cada parti¬ 
cipante. O total pode ser obtido adicionando os 
produtos cruzados de todos os participantes. A 
Tabela 14.2 ilustra esse processo. 

CPt y X +YArorsi V(3 era |(A£(> es )) 

(-b(Pensamentos) ^Geral(Pensamentos) (14.1) 

O produto cruzado total e uma avaliagao 
do relacionamento global entre as duas varia¬ 
veis. Contudo, estamos, tambem, interessados 
em como o relacionamento entre as variaveis 
dependentes e influenciado pela manipulagao 
experimental e esse relacionamento e mensu- 
rado pelo produto cruzado do modelo (CP M ). 
O CP M e calculado de modo semelhante a 
soma dos quadrados do modelo. Primeiro, 
a diferenga entre a media de cada grupo e a 
media geral e calculada para cada variavel de¬ 
pendente. O produto cruzado e calculado mul- 
tiplicando-se as diferengas encontradas para 
cada grupo. Cada produto e entao multipli¬ 
cado pelo numero de escores dentro do grupo 
(como foi feito com a soma dos quadrados). 
Esse princfpio e ilustrado na equagao (14.2) e 
na Tabela 14.3: 


cp m — y^/i\(x G 

C^Grupo(Pensamentos) -^Geral(Pensamentos))] (14.2) 


^GrupofAgoes) -^Geral(Asoes)) 
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Tabela 14.1 Calculos para obter o Produto Cruzado Total (CP T ) 


Grupo Actions (Agoes) 

Thoughts 

(Pensamentos) 

Actions — 

'^Geral(Actions) 

(D,) 

Thoughts — 

^Geral (Thoughts) 

(D 2 ) 

D, x D 2 

5 

14 

0,47 

-0,53 

-0,25 

5 

11 

0,47 

-3,53 

-1,66 

4 

16 

-0,53 

1,47 

-0,78 

4 

13 

-0,53 

-1,53 

0,81 

5 

12 

0,47 

-2,53 

-1,19 

TCC 





3 

14 

-1,53 

-0,53 

0,81 

7 

12 

2,47 

-2,53 

-6,25 

6 

15 

1,47 

0,47 

0,69 

6 

16 

1,47 

1,47 

2,16 

4 

11 

-0,53 

-3,53 

1,87 

4 

14 

-0,53 

-0,53 

0,28 

4 

15 

-0,53 

0,47 

-0,25 

1 

13 

-3,53 

-1,53 

5,40 

1 

14 

-3,53 

-0,53 

1,87 

4 

15 

-0,53 

0,47 

-0,25 

TC 





6 

19 

1,47 

4,47 

6,57 

5 

13 

0,47 

-1,53 

-0,72 

5 

18 

0,47 

3,47 

1,63 

2 

14 

-2,53 

-0,53 

1,34 

5 

17 

0,47 

2,47 

1,16 

4 

13 

-0,53 

-1,53 

0,81 

5 

15 

0,47 

0,47 

0.22 

5 

14 

0,47 

-0,53 

-0,25 

4 

14 

-0,53 

-0,53 

0,28 

6 

13 

1,47 

-1,53 

-2,25 

ST 





4 

20 

-0,53 

5,47 

-2,90 

7 

13 

2,47 

-1,53 

-3,78 

4 

16 

-0,53 

1,47 

-0,78 

6 

14 

1,47 

-0,53 

-0,78 

5 

18 

0,47 

3,47 

1,63 

-^Geral) ^.53 

14,53 


CP T = Z(D, 

X D 2 ) = 5,47 


Tabela 14.3 Calculos para obter o Produto Cruzado do Modelo (CP M ) 


Grupo 

y 

/v Grupo 

Actions 

^Grupo ^Geral 

(D,) 

y 

S' Grupo 

Thoughts 

•^Grupo ^Geral 

(D 2 ) 

D, x D 2 

N(D , x D 2 ) 

TCC 

4,9 

0,37 

13,4 

-1,13 

-0,418 

-4,18 

TC 

3,7 

-0,83 

15,2 

0,67 

-0,556 

-5,56 

ST 

5,0 

0,47 

15,0 

0,47 

0,221 

2,21 

^Geral) 

4,53 


14,53 


CP M = Z/V(0, 

X D 2 ) =- 7,53 
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Finalmente, precisamos, ainda, saber como 
o relacionamento entre as duas variaveis de- 
pendentes e influenciado pelas diferengas in¬ 
dividuals do desempenho dos participantes. O 
produto cruzado residual (CP R ) nos informa 
sobre como o relacionamento entre as varia¬ 
veis dependentes e afetado pelas diferengas 
individuals, ou erro no modelo. O CP R e cal- 
culado de modo similar ao produto cruzado 
total exceto que a media dos grupos e utili- 
zada em vez da media geral (veja a equagao 
(14.3)). Assirn, para calcular a diferenga de 
cada escore, tomamos cada escore e subtraf- 
mos da media do grupo ao qual ele pertence 
(veja a Tabela 14.4): 

/ f ^i (ArnnRi -^Grupo(A 5 oes)) 

(-h'(Pensamentos) ^Grupo (Pensamentos)) (14.3) 

Os observadores entre voces irao notar 
que o produto cruzado dos resfduos pode tam- 
bem ser calculado pela subtragao do produto 
cruzado do modelo do produto cruzado total: 

CP R = CP T — CP M 

= 5,47 - (-7,53) = 13 

Entretanto, e util calcular o produto cru¬ 
zado residual manualmente para o caso de al- 
gum erro no calculo dos outros dois produtos 
cruzados. O fato que a soma dos produtos cru¬ 
zados do modelo e dos resfduos deve forne- 
cer o produto cruzado total pode ser utilizado 
como uma forma util de contraprova. 

Cada um dos diferentes produtos cruza¬ 
dos nos informa algo importante sobre o re¬ 
lacionamento entre as duas variaveis depen¬ 
dentes. Embora eu tenha utilizado um cenario 
simples para manter os calculos relativamente 
simples, esses princfpios podem ser facilmen- 
te estendidos para cenarios mais complexos. 
Por exemplo, se tivessemos mensurado tres 
variaveis dependentes, entao os produtos 
cruzados entre os pares de variaveis depen¬ 
dentes seriam calculados (como foram nesse 
exemplo) e colocados na matriz SSCP apro- 
priada (veja a proxima segao). A medida que 
a complexidade da situagao aumenta, tambem 


cresce a quantidade de calculos que precisam 
ser realizados. Nessas situagoes, a vantagem 
de um software como o SPPS se torna mais 
aparente! 

14.3.3.4 A matriz SSCP total (T) © 

Nesse exemplo, temos somente duas va¬ 
riaveis dependentes e, assim, todas as matri- 
zes SSCP serao matrizes do tipo 2x2. Se exis- 
tissem tres variaveis dependentes, as matrizes 
resultantes teriam dimensao 3x3. A matriz 
SSCP total, ou T, content a soma dos totais dos 
quadrados para cada variavel dependente e o 
produto cruzado total entre as duas variaveis 
dependentes. Voce pode intaginar a primeira 
coluna e a primeira linha como representando 
uma variavel dependente e a segunda coluna e 
linha como representando a segunda variavel 
dependente: 




Coluna 2 


Coluna 1 
Actions (Agoes) 

Thoughts 

(Pensamentos) 

Linha 1 

Actions (AQoes) 

Actions) 

CP T 

Linha 2 



Thoughts 

(Pensamentos) 

CP T 

^^T(Thoughts) 


Ja calculamos esses valores nas segoes 
anteriores e assim podemos simplesmente 
coloca-los nas celulas adequadas da matriz: 

61,47 5,47\ 

5,47 141,47/ 

A partir dos valores da matriz (e do 
que eles representam) deve estar claro que 
a SSCP total representa tanto a quantidade 
de variagao que existe dentro dos dados e a 
codependencia total que existe entre as va¬ 
riaveis dependentes. Voce deve notar ainda 
que os elementos fora da diagonal sao iguais 
(eles sao o produto cruzado total) porque esse 
valor e igualmente importante para as duas 
variaveis dependentes. 
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Tabela 14.4 Calculos para obter o Produto Cruzado Residual (CP R ) 


Grupo 

Actions (A;oes) 

Actions — 

y 

xv Grupo(Actions) 

(D,) 

Thoughts 

(Pensamentos) 

Thoughts — 

y 

^ Grupo(Thoughts) 

(D 2 ) 

D, x D 2 


5 

0,10 

14 

0,60 

0,06 


5 

0,10 

11 

-2,40 

-0,24 


4 

-0,90 

16 

2,60 

-2,34 


4 

-0,90 

13 

-0,40 

0,36 


5 

0,10 

12 

-1,40 

-0,14 

TCC 







3 

-1,90 

14 

0,60 

-1,14 


7 

2,10 

12 

-1,40 

-2,94 


6 

1,10 

15 

1,60 

1,76 


6 

1,10 

16 

2,60 

2,86 


4 

-0,90 

11 

-2,40 

2,16 

^TCC 

4,9 


13,4 


S = 0,40 


4 

0,30 

14 

-1,20 

-0,36 


4 

0.30 

15 

-0,20 

-0,06 


1 

-2,70 

13 

-2,20 

5,94 


1 

-2,70 

14 

-1,20 

3,24 

TC 

4 

0,30 

15 

-0,20 

0,06 

6 

2,30 

19 

3,80 

8,74 


5 

1,30 

13 

-2,20 

-2,86 


5 

1,30 

18 

2,80 

3,64 


2 

-1,70 

14 

-1,20 

2,04 


5 

1,30 

17 

1,80 

2,34 

^TC 

3,7 


15,2 


I = 22,60 


4 

-1,00 

13 

-2,00 

2,00 


5 

0,00 

15 

0,00 

0,00 


5 

0,00 

14 

-1,00 

0,00 


4 

-1,00 

14 

-0,00 

1,00 


6 

1,00 

13 

-2,00 

-2,00 

ST 







4 

-1,00 

20 

5,00 

-5,00 


7 

2,00 

13 

-2,00 

-4,00 


4 

-1,00 

16 

1,00 

-1,00 


6 

1,00 

14 

-1,00 

-1,00 


5 

0,00 

18 

3,00 

0,00 

^ST 

5 


15 

CP R = Z(D, x D 2 ) 

1 = -10,00 

= 13 


14.3.3.5 A matriz SSCP Residual (E) ® 

A matriz SSCP residual (ou erro), E, con¬ 
tent a soma dos quadrados dos resfduos para 
cada variavel dependente e o produto cruza¬ 


do residual entre as duas variaveis dependen- 
tes. Essa matriz SSCP e semelhante a matriz 
SSCP total, exceto que a informapao esta rela- 
cionada aos erros do modelo: 
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Coluna 2 


Coluna 1 

Thoughts 


Actions (Agoes) 

(Pensamentos) 

Linha 1 

Actions (Agoes) 

SS R(Ac tions) 

CPr 

Linha 2 

Thoughts 

(Pensamentos) 

CPr 

SS R(Thou g hts ) 


Ja calculamos esses valores nas segoes 
anteriores e, assim, podemos simplesmente 
coloca-los nas celulas adequadas da matriz: 



A partir dos valores da matriz (e do que 
eles representam), deve estar claro que a SSCP 
residual representa a quantidade de variagao 
nao-sistematica que existe em cada variavel 
dependente e a codependencia que existe en- 
tre variaveis dependentes devida apenas a fa- 
tores casuais. Como antes, os elementos fora 
da diagonal sao iguais (ambos sao produtos 
cruzados residuais). 

14.3.3.6 A matriz SSCP do modelo (H) © 

A matriz SSCP do modelo (ou hipotese), H, 
contem a soma dos quadrados do modelo para 
cada variavel dependente e o produto cruzado 
residual entre as duas variaveis dependentes: 




Coluna 2 


Coluna 1 

Thoughts 


Actions (Agoes) 

(Pensamentos) 

Linha 1 

Actions (Agoes) 

Actions) 

CPm 

Linha 2 

Thoughts 

(Pensamentos) 

cp„ 

^^M(Thoughts) 


Esses valores foram calculados nas segoes 
anteriores e assim podemos simplesmente co- 
locar os numeros apropriados nas celulas ade¬ 
quadas da matriz (veja abaixo). A partir desses 
valores na matriz (e o que eles representam), 
deve estar claro que a SSCP do modelo repre¬ 
senta tanto a variagao sistematica que existe 


para cada variavel dependente quanto a code¬ 
pendencia entre as variaveis dependentes de- 
vido ao modelo (isto e, devido a manipulagao 
experimental). Como antes, os elementos fora 
da diagonal sao os mesmos (ambos represen¬ 
tam o produto cruzado do modelo): 

„( 10,47 —7,53\ 

1-7,53 19,47/ 

Matrizes sao aditivas, o que significa que 
podemos somar (ou subtrair) duas matrizes 
pela adigao (ou subtragao) dos elementos cor- 
respondentes. Quando calculamos a ANOVA 
univariada, vimos que a soma total dos qua¬ 
drados era a soma dos quadrados do modelo 
com a soma dos quadrados dos residuos (isto 
e, SS T = SS M + SS R ). O mesmo e verdadeiro 
para a MANOVA, exceto que estamos adicio- 
nando matrizes e nao simplesmente valores: 

T = H + E 

10,47 —7,53\ / 51 13\ 

-7,53 19,47/ + \13 122/ 

10.47 + 51 —7,53 +13\ 

—7,53 +13 19,47+122/ 

61.47 5,47\ 

5,47 141,47/ 

A demonstragao de que essas matrizes 
podem ser somadas ajuda voce a entender (eu 
espero!) que os calculos da MANOVA sao 
conceitualmente os mesmos da ANOVA uni¬ 
variada, com a diferenga sendo que sao utili- 
zadas matrizes em vez de valores simples. 

14.3.4 Principios do teste estatistico 
MANOVA © 

Na ANOVA univariada, calculamos a 
razao da variancia sistematica pela nao-sis¬ 
tematica (isto e, dividimos SS M por SS R ). 2 O 
equivalente conceitual sera, portanto, dividir 
a matriz H pela matriz E. Existe, entretanto, 


2 Na realidade, utilizamos a media dos quadrados, mas 
esses valores sao meramente as somas dos quadrados 
corrigidos para os graus de liberdade. 
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o problema de que matrizes nao sao divisfveis 
por outras matrizes! Contudo, existe uma ope- 
ragao matricial equivalente a divisao, que e 
multiplicar uma das matrizes pelo mverso da 
outra. Assirn, se queremos dividir a matriz H 
pela E, temos que multiplicar a matriz H pela 
matriz inversa da E (representada por E' 1 ). As- 
sim, a estatfstica teste e baseada na matriz que 
resulta da multiplicagao da SSCP do modelo 
pela inversa da SSCP residual. Essa matriz e 
representada por HE -1 . 

Calcular a inversa de uma matriz e uma 
operagao dificil e trabalhosa e voce nao pre- 
cisa entender como isso e feito, pois o SPSS 
faz automaticamente. Contudo, os leitores 
interessados podem consultar Stevens (1992) 
ou Namboodiri (1984) - esses textos forne- 
cem material bastante acessfvel sobre como 
calcular a inversa de uma matriz. Para os 
leitores que irao consultar essas fontes, os 
calculos desse exemplo estao inclufdos no ar- 
quivo do site www.artmed.com.br Appendix 
Chapter 14.pdf (voce pode querer verificar 
os meus calculos!). Ja os leitores nao interes¬ 
sados devem acreditar que: 

0,0202 -0,0021) 
-0,0021 0,0084 ) 

0,2273 -0,0852) 
-0,1930 0,1794/ 

Lembre que HE -1 representa a razao en- 
tre a variancia sistematica do modelo para a 
variancia nao-sistematica e, assim, a matriz 
resultante e conceitualmente a mesma razao F 
da ANOVA univariada. Esse e outro proble¬ 
ma, tambem. Na ANOVA, quando dividimos 
a variancia sistematica pela nao-sistematica, 
obtemos um unico numero: a razao F. Na MA- 
NOVA, quando dividimos a variancia sistema¬ 
tica pela nao-sistematica obtemos uma matriz 
contendo varios valores. Nesse exemplo, a 
matriz contem quatro valores, mas se tivesse- 
mos tres variaveis dependentes a matriz teria 
nove valores. De fato, a matriz resultante sem- 
pre ira conter p 2 valores, onde peo numero 
de variaveis dependentes. O problema e como 
converter esses valores da matriz em um unico 


valor que tenha sentido. Esse e o ponto onde 
teremos que abandonar qualquer esperanga de 
entender a matematica por tras do teste e falar 
apenas conceitualmente. 

14.3.4.1 Afungao discriminante © 

O problema de ter varios valores para 
determinar a significance estatfstica pode 
ser simplificado pela conversao das varia¬ 
veis dependentes em dimensoes subjacentes 
ou fatores (esse processo sera discutido com 
mais detalhes no Capftulo 15). No Capftulo 
5, vimos como a regressao multipla funcio- 
na ajustando um modelo linear ao conjunto 
de dados para prever uma variavel de safda 
(a variavel dependente na terminologia da 
ANOVA). Esse modelo linear e construfdo 
por uma combinagao das variaveis previsoras 
(ou variaveis independentes), onde cada uma 
tem uma contribuigao unica para o modelo li¬ 
near. Podemos fazer algo similar aqui. exceto 
que estamos interessados no problema oposto 
(isto e, prever uma variavel independente a 
partir de um conjunto de variaveis dependen¬ 
tes). Assim, e possfvel calcular as dimensoes 
subjacentes das variaveis dependentes. Essas 
combinagoes lineares das variaveis depen¬ 
dentes sao conhecidas como variates (ou 
as vezes denominadas variaveis latentes ou 
fatores). Nesse contexto, queremos utilizar 
essas combinagoes lineares de variaveis (va¬ 
riates) para prever a que grupo uma pessoa 
pertence (isto e, se ele esta no grupo TCC, 
TC ou ST), assim, nos as estamos utilizando 
para discriminar grupos de pessoas. Portan- 
to, essas variates sao denominadas fungdes 
discriminantes. Embora eu tenha feito um 
paralelo entre essas fungoes discriminantes e 
o modelo de regressao multipla, existe uma 
diferenga no sentido de que podemos extrair 
varias fungdes discriminantes de um conjunto 
de variaveis dependentes, enquanto na regres¬ 
sao multipla todas as variaveis independentes 
estao inclufdas em um unico modelo. 

Essa e a teoria em termos simplistas, 
mas como descobrimos essas fungoes discri¬ 
minantes? Sem entrar em muitos detalhes, 
utilizamos um procedimento matematico de 
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maximizagao, de modo que a primeira fungao 
discriminante (VQ seja a combinagao linear 
das variaveis dependentes que maximizam as 
diferengas entre grupos. 

Segue disso que a razao entre as varian- 
cias sistematicas e nao-sistematicas (SS M /SS R ) 
sera maximizada para a primeira variate, mas 
variates subsequentes terao valores menores 
dessa razao. Lembre que essa razao e um valor 
analogo do que a razao F representa na ANO- 
VA univariada e, assim, obtemos o valor maxi- 
mo possfvel da razao F quando olhamos para 
a primeira fun^ao discriminante. Essa variate 
pode ser descrita em termos de uma equacao 
de regressao linear (porque ela e uma combi- 
nacao linear das variaveis dependentes): 

Y = b 0 + b i X l + b 2 X 2 

Vj = b 0 + b l VD l + b 2 VD 2 (14.4) 

Vi = b 0 + biAqoes + f? 2 Pensamentos 

A Equa$ao (14.4) mostra as equates de 
regressao nrultiplas para dois previsores e es- 
tende isso para mostrar como uma forma seme- 
lhante da equacao pode ser descrita como fun- 
goes discriminantes. Os valores b na equaqao 
sao pesos (como na regressao) que nos infor¬ 
mant algo sobre a contribu^ao de cada variavel 
dependente para a combina 5 ao linear ( variate) 
em questao. Na regressao, os valores de b sao 
obtidos pelo metodo dos mfnimos quadrados; 
na analise da fungao discriminante, os valores 
b sao obtidos a partir dos auto-vetores (veja o 
Quadra 5.2) da matriz FIE' 1 . Podemos ignorar 
b 0 porque ele serve somente para localizar a 
variate no espago geometrico, o que nao e ne- 
cessario quando estivermos utilizando-a para 
discriminar grupos. 

Numa situa§ao na qual existem apenas 
duas variaveis dependentes e dois grupos para 
a variavel independente, existira apenas uma 
combina§ao linear (variate). Isso torna o ce- 
nario bem simples: olhando para a funcao dis¬ 
criminante das variaveis dependentes, em vez 
de olhar para as proprias variaveis dependen¬ 
tes, podemos obter um unico valor do SS M / 
SS R para a fu ncao discriminante e entao ava- 
liar a significancia desse valor. Contudo, em 


casos mais complexos quando existirem mais 
do que duas variaveis dependentes ou mais do 
que tres nfveis da variavel independente (como 
e o caso do nosso exemplo), existira mais do 
que uma combinaqao linear (CL) ou variate. 
O numero de CL obtidos sera menor do que p 
(o numero de variaveis dependentes) ou k - 1 
(onde keo numero de nfveis da variavel inde¬ 
pendente). No nosso exemplo, tanto p quan¬ 
to k - 1 sao iguais a 2 e, assim, devemos ser 
capazes de encontrar duas CLs (ou variates). 
Mencionei antes que os valores b que des- 
crevem as CLs sao obtidos pelo calculo dos 
autovetores da matriz HE' 1 e, de fato, existem 
dois autovetores derivados dessa matriz; um 
com os valores b para a primeira CL e outro 
com o b da segunda CL. Falando conceitual- 
mente, os autovetores sao vetores associados 
com uma dada matriz que nao mudam quando 
a matriz e diagonalizada (veja o Quadra 5.2 
para uma cxplicacao visual de autovalores e 
autovetores). Uma matriz diagonal ou diago¬ 
nalizada e simplesmente uma matriz em que 
os elementos fora da diagonal sao todos iguais 
a zero, e transformando HE' 1 em uma matriz 
diagonal, eliminamos todos os elementos fora 
da diagonal (reduzindo assim o numero de va¬ 
lores para os quais devemos testar a signifi¬ 
cancia. Entretanto, calculando os autovetores 
e autovalores, ainda estaremos com varios va¬ 
lores que representam a razao entre as varian- 
cias sistematica e nao-sistematica (porque eles 
nao mudam pela diagonalizaqao da matriz), 
mas agora existem menos valores. Os calcu- 
los para obter os autovetores sao complexos 
(estudantes insanos podem tentar a leitura de 
Strang, 1980 ou Namboodiri, 1984), assim, 
para a matriz HE' 1 os autovetores sao: 


Autovetor,=(_^03) 

Autovetor 2 = g425j 


Substituindo esses dois valores nas duas 
cquacbes para as CLs e lembrando que pode¬ 
mos ignorar o valor de b 0 , obtemos os mode- 
los apresentados na equacao (14.5) 
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V) = 0,603Agoes — 0,335 Pensamentos (14.5) 
V 2 = 0,425Agoes + 0339Pensamentos 

E possrvel utilizar as equagoes para cada 
CL a fim de calcular um escore para cada 
pessoa na CL. Por exemplo, o primeiro par¬ 
ticipate no grupo TCC apresentou 5 agoes 
obsessivas e 14 pensamentos obsessivos. Por- 
tanto, seu escore na CL, sera —1,675: 

= (0,603 x 5) + (0,335x14) = -1,675 

O escore para a segunda CL sera 6,87: 

V 2 = (0,425 x 5) + (0,339 x 14) = 6,871 

Se calcularmos esses escores CL para 
cada participante e depois calcularmos as ma- 
trizes SSCP (por exemplo, H, E, Te HE -1 ) que 
utilizamos previamente, encontrarlamos todos 
eles como tendo produtos cruzados iguais a 
zero. Isso porque as CLs extraldas dos dados 
sao ortogonais, o que significa que elas nao 
sao correlacionadas. Em resumo, as CLs ex¬ 
traldas sao dimensoes independentes constru- 
Idas como uma combinagao linear das varia- 
veis dependentes que foram mensuradas. 

Essa redugao dos dados apresenta pro- 
priedades uteis no sentido de que se olharmos 
para a matriz HE -1 calculada a partir dos es¬ 
cores CLs (em vez das variaveis dependen¬ 
tes), encontraremos que todos os elementos 
fora da diagonal (os produtos cruzados) serao 
zero. Os elementos da diagonal dessa matriz 
representam a razao da variancia sistematica 
para a nao-sistematica (isto e, SS M /SS X ) para 
cada uma das CLs subjacentes. Assim, para 
os dados do nosso exemplo, isso significa 
que em vez de ter quatro valores representan- 
do a razao entre as variancias sistematicas e 
nao-sistematicas, teremos apenas dois. Essa 
redugao pode nao parecer muito. Contudo, 
em geral, se tivermos variaveis dependentes 
p, normalmente acabarlamos tendo valores p 2 
representando a razao entre as variancias sis¬ 
tematicas e nao-sistematicas; pela utilizagao 
das fungSes discriminantes, reduzimos esse 
numero para p. Se existirem quatro variaveis 
dependentes, acabarlamos com quatro valores 


em vez de 16 (o que destaca as vantagens des- 
se processo). 

Para os dados do nosso exemplo, a matriz 
HE 1 calculada a partir dos escores das CLs e: 

_/0,335 0,000) 

CLs \o,000 0,073/ 

Fica claro a partir dessa matriz que temos 
dois valores para serem considerados quando 
avaliarmos a significancia das diferengas entre 
grupos. Isso provavelmente pareceu um pro- 
cedimento complicado para reduzir os dados 
dessa forma: contudo, ele mostra que os va¬ 
lores ao longo da diagonal da matriz para as 
CLs (ou seja, 0,335 e 0,073) sao os autova- 
lores da matriz HE -1 original. Portanto, esses 
valores podem ser calculados diretamente dos 
dados coletados sem a necessidade de primei¬ 
ro determinar os autovetores. Os calculos des¬ 
ses autovalores estao incluldos nos apendices, 
mas nao e necessario que voce entenda como 
eles sao obtidos. Esses autovalores sao con- 
ceitualmente equivalentes a razao F na ANO- 
VA e, assim, o passo final e avaliar quao gran¬ 
de eles sao quando comparados com o que se 
esperaria apenas pelo acaso. Existem quatro 
formas de avaliar esses valores. 


14.3.4.2 Trago de Pillai-Bartlett (V) © 

O trago de Pillai-Bartlett (tambem conhe- 
cido como trago de Pillai) e dado na equagao 
(14.6), na qual X representa os autovalores 
para cada uma das fungoes discriminantes e 
s representa o numero dessas fungoes. O trago 
de Pillai e a soma das proporgoes da variancia 
explicada nas fungoes discriminantes. Como 
tal, ele e semelhante a razao SS M /SS T : 




A, 

1 + A; 


(14.6) 


Para os nossos dados, esse trago e 0,319, 
que pode ser transformado em um valor que 
tem uma distribuigao aproximada F. 


0,335 0,073 

V —-1- 

1 + 0,335 1 + 0,073 


0,319 
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14.3.4.3 T 2 de Hotelling © 

O traco de Hotelling-Lawley ou T 2 de Ho¬ 
telling (Figura 14.1) e simplesmente a soma 
dos autovalores para cada CL (veja a Equa- 
gao (14.7)), e para esses dados o seu valor e 
0,408 (0,335 + 0,073). Essa estatistica teste 
e a soma da SS M /SS T para cada CL e, desse 
modo, ela se compara diretamente a razao F 
da ANOVA: 


r = (14.7) 

1=1 


14.3.4.4 Lambda de Wilks (A) © 

O lambda de Wilks (A) e o produto da 
variancia nao-explicada em cada CL (veja a 
Equagao (14.8) - o slmbolo II e semelhante 
ao slmbolo para a soma (2) que ja encontra- 
mos, exceto que ele significa multiplicar em 
vez de somar). Assim, o lambda de Wilks re- 
presenta a razao da variancia do erro pela va¬ 
riancia total (SS R /SS X ) para cada CL: 



Figura 14.1 Harold Hotelling saboreando um 
cha, minha atividade favorita. 


A =niri (l4 - 8) 

Para os dados, nesse exemplo, o valor e 
0,698 e deve ficar claro que valores de auto¬ 
valores grandes (que representam um grande 
efeito experimental) levam a pequenos valores 
do lambda de Wilks, portanto, existe signifi- 
cancia estatistica quando o lambda de Wilks 
for pequeno: 



14.3.4.5 Maior raiz de Roy © 

A maior raiz de Roy sempre me faz pen- 
sar em um estatlstico barbudo com uma pa de 
jardim arrancando uma enorme raiz de man- 
dioca (ou outra semelhante); contudo, nao e 
uma mandioca como o nome sugere, mas sim¬ 
plesmente o autovalor para a primeira CL. As¬ 
sim, em certo sentido, ela e igual ao trago de 
Hotelling-Lawley, mas apenas para a primeira 
CL (veja a Equagao (14.9)): 

Maior raiz = 2 m aximo (14.9) 



Como tal, a maior raiz de 
Roy representa a proporgao da 
variancia explicada pela 
nao-explicada (SS M /SS R ) para 
a primeira fungao discriminan- 
te. 3 Para os dados nesse exemplo, o valor da 
maior raiz de Roy e simplesmente 0,335 (o 
autovalor para a primeira fungao CL). Assim, 
esse valor e conceitualmente equivalente a ra¬ 
zao F na ANOVA univariada. Deve ser apa- 
rente, a partir do que aprendemos sobre as 
propriedades de maximizagao das fungoes 
discriminantes, que a raiz de Roy representa a 
diferenga maxima posslvel entre grupos dos 
dados coletados. Contudo, em muitos casos 
essa estatistica deve ser a mais poderosa. 


3 Essa estatistica e algumas vezes caracterizada como 
Kiti m/u + Vfaimo). mas nao e a estatistica apresentada 
pelo SPSS. 
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14.4 HIPOTESES DA MANOVA @ 

A MANOVA tem suposigoes semelhantes 
a ANOVA, porem estendidas para o caso mul- 
tivariado: 

• Independencia: As observagoes devem 
ser estatisticamente independentes. 

• Amostragem aleatoria: Os dados devem 
ser aleatoriamente selecionados da popu- 
lagao de interesse e mensurados a um ni- 
vel de intervalo pelo menos. 

• Normalidade multivariada: Na ANO¬ 
VA, assumimos que nossa variavel depen- 
dente e normalmente distribufda dentro 
de cada grupo. No caso da MANOVA, 
assumimos que as variaveis dependentes 
(coletivamente) tem normalidade multi¬ 
variada nos grupos. 

• Homogeneidade das matrizes de co- 
variancia: Na ANOVA, assumimos que 
as variancias em cada grupo sao apro- 
ximadamente iguais (homogeneidade 
das variancias). Na MANOVA devemos 
assumir que isso e verdadeiro para cada 
variavel dependente, mas tambem que as 
correlagoes entre quaisquer duas variaveis 
dependentes sejam as mesmas para todos 
os grupos. Essa hipotese e examinada 
testando se a populagao das matrizes das 
variancias-covariancias dos grupos sendo 
analisados sao iguais. 4 

Quando essas hipoteses sao violadas, 
a precisao dos resultados da estatfstica tes¬ 
te multivariada fica comprometida. Assim, 
o que fazer? Bern, o SPSS nao oferece uma 
versao nao-parametrica da MANOVA; contu- 
do, algumas ideias ja foram adiantadas com 
base em postos (muito semelhante aos testes 
nao-parametricos vistos no Capitulo 13). Em- 
bora as discussoes desses testes estejam alem 
dos propositos desse texto, Zwick (1985) su- 
gere algumas ideias que podem ser vantajosas 


4 Para voces que leem sobre matrizes SSCP, se pensarem 
sobre o relacionamento entre as somas dos quadrados 
com variancias e produtos cruzados com correlagoes, 
deve ficar claro que a matriz de variancia-covariancia e 
basicamente uma forma padronizada da matriz SSCP. 


quando a normalidade multivariada ou a ho¬ 
mogeneidade das matrizes de covariancia nao 
podem ser assumidas. 

14.4.1 Verificando as hipoteses (D 

Muitas das hipoteses podem ser testadas 
da mesma forma que nos testes univariados 
(veja o Capitulo 8); as suposicoes adicionais 
da normalidade multivariada e da igualdade 
das matrizes das covariancias requerem pro- 
cedimentos diferentes. A hipotese de norma¬ 
lidade multivariada nao pode ser testada no 
SPSS e, assim, a unica solugao pratica e tes- 
tar a hipotese da normalidade univariada para 
cada variavel dependente (veja o Capitulo 3). 
Essa solugao e pratica (porque e facil de ser 
implementada) e util (porque a normalidade 
univariada e uma condigao necessaria para a 
normalidade multivariada), mas ela nao ga- 
rante a normalidade multivariada. Assim, 
embora essa abordagem seja o melhor que 
podemos fazer, sugiro aos leitores que consul- 
tern Stevens (1992, Capitulo 6), que fornece 
algumas solutes alternativas. 

A suposigao de igualdade das matrizes 
de covariancias e mais facil de ser verificada. 
Primeiro, para que essa hipotese seja verda- 
deira, os testes univariados de igualdade de 
variancias entre grupos devem ser satisfeitos. 
Essa hipotese e facilmente verificada pelo 
teste de Levene (veja a Segao 3.6). Como um 
teste preliminar, o de Levene nao deve ser 
significativo para qualquer uma das variaveis 
dependentes. Entretanto, o teste de Levene 
nao leva em conta as covariancias e assim as 
matrizes de variancias-covariancias devem 
ser comparadas entre os grupos com a utili- 
zagao do teste de Box. Esse teste nao deve ser 
significativo se as matrizes sao semelhantes. 
Contudo, o teste de Box e muito suscetfvel a 
desvios da normalidade multivariada e, as¬ 
sim, pode nao ser significativo nao porque 
as matrizes sejam semelhantes, mas porque a 
hipotese de normalidade multivariada nao foi 
satisfeita. Por isso, e crucial saber se os da¬ 
dos tem uma distribuigao normalmente mul¬ 
tivariada antes de interpretar os resultados do 
teste de Box. 
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14.4.2 Escolhendo o teste estatistico © 

Somente quando exis- 
te uma CL ( variate) sub- 
jacente serao necessarios 
que os quatro testes esta- 
tfsticos sejam os mesmos. 
Portanto, e importante 
saber que teste e melhor 
em termos de poder e ro- 
bustez. Tanto Olson (1974; 1976; 1979) quanto 
Stevens (1979) fizeram um extensivo trabalho 
sobre o poder de quatro testes MANOVA. Ol¬ 
son (1974) observou que para tamanhos amos- 
trais pequenos e moderados, as quatro estatfs- 
ticas diferem pouco em termos de poder. Se as 
diferengas entre os grupos estiverem concen- 
tradas na primeira CL (como muitas vezes e o 
caso na pesquisa em ciencias sociais), a esta- 
tfstica de Roy devera ser a mais poderosa (por- 
que ela leva em conta apenas a primeira CL), 
seguido pelo trago de Hotelling, lambda de 
Wilks e o trago de Pillai. Contudo, quando os 
grupos diferem ao longo de mais de uma CL 
(Combinagao Linear ou variate), o poder e 
contrario (isto e, o trago de Pilai e o mais pode- 
roso e a raiz de Roy, o menos). Uma questao 
final com respeito ao poder dos testes e quanto 
ao tamanho da amostra e o numero de varia- 
veis dependentes. Stevens (1980) recomenda a 
utilizagao de um numero pequeno de variaveis 
dependentes (menos do que 10), exceto se os 
tamanhos amostrais forem grandes. 

Em termos de robustez, os quatro testes 
estatfsticos sao relativamente robustos a vio- 
lagoes da normalidade multivariada (embora 
a raiz de Roy seja afetada por distribuigoes 
platicurticas - ver Olson, 1976). A raiz de Roy 
tambem nao e robusta quando a homogeneida- 
de das matrizes de covariancias nao se verifica 
(Stevens, 1979). O trabalho de Olson e Stevens 
levaram Bray e Maxwell (1985) a concluir que 
quando tamanhos amostrais sao iguais, o trago 
de Pillai-Bartlett e o mais robusto a violagoes 
das hipoteses. Contudo, quando os tamanhos 
amostrais sao diferentes, essa estatistica e 
afetada pela violagao da hipotese de igualda- 
de das matrizes de covariancias. Como regra, 
com grupos desiguais, verifique a hipotese 


de homogeneidade das matrizes de covarian¬ 
cias utilizando o teste de Box; se ele nao for 
significativo, e se a hipotese de normalidade 
multivariada e verdadeira (o que nos permite 
assumir que o teste de Box e preciso), assuma 
que o trago de Pillai e o melhor. 

14.4.3 Analise adicional © 

Na Segao 14.2.2.1, mencionei que exis- 
tiam algumas controversias sobre o quanto e 
util uma analise adicional na MANOVA. A 
abordagem tradicional e seguir uma MANO¬ 
VA significativa com ANOVAs separadas em 
cada uma das variaveis dependentes. Se essa 
abordagem for tomada, voce podera se per- 
guntar por que se preocupar com a MANOVA 
(anteriormente, disse que multiplas ANOVAs 
nao era uma boa abordagem). Bern, a ANO- 
VA que da prosseguimento a uma MANOVA 
significativa e dita “protegida” pela MANO¬ 
VA inicial (Bock, 1975). A ideia e que o tes¬ 
te multivariado global protege contra erros 
do Tipo I inflados porque se o teste inicial e 
nao-significativo (isto e, a hipotese nula e ver¬ 
dadeira), qualquer teste subsequente e ignora- 
do (qualquer significancia deve ser um erro do 
Tipo I porque a hipotese nula e verdadeira). 
Contudo, a nogao de protegao e um tanto fa- 
laciosa porque uma MANOVA significativa, 
frequentemente, reflete uma diferenga signi¬ 
ficativa para uma, mas nao todas, as variaveis 
dependentes. ANOVAs subsequentes sao entao 
executadas em todas as variaveis dependentes, 
mas a MANOVA protege somente a variavel 
dependente para a qual existe uma diferenga 
de grupo genufna (veja Bray e Maxwell, 1985, 
p. 40-41). Portanto, voce pode considerar a 
aplicagao da corregao de Bonferroni as ANO¬ 
VAs posteriores (Harris, 1975). 

A abordagem da ANOVA como sequen- 
cia da MANOVA implicitamente assume que 
uma MANOVA significativa nao e devida as 
variaveis dependentes representando um con- 
junto de dimensoes subjacentes que diferen- 
ciam os grupos. Portanto, alguns pesquisado- 
res advogam o uso da analise discriminante, 
que encontra as combinagoes lineares das 
variaveis dependentes que melhor separa (ou 


Que teste 
estatistico 
devo usar? 
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discrimina) os grupos. Esse procedimento esta 
mais de acordo com o espfrito da MANOVA 
porque engloba os relacionamentos que exis- 
tem entre as variaveis dependentes e e certa- 
mente util para iluminar os relacionamentos 
entre as variaveis dependentes e a pertinencia 
aos grupos. A maior vantagem dessa aborda- 
gem sobre multiplas ANOVAs e que ela reduz 
e explica as variaveis dependentes em termos 
de um conjunto de dimensoes subjacentes 
que podem refletir dimensoes psicologicas ou 
teoricas substantivas. Por omissao, o procedi¬ 
mento MLG padrao no SPSS fornece ANO¬ 
VAs univariadas, mas nao a analise discri¬ 
minante. 5 Entretanto, a analise discriminante 
pode ser acessada via diferentes menus, e no 
restante deste capltulo iremos utilizar os da¬ 
dos do TOC (Transtorno Obsessivo-Compul- 
sivo) para ilustrar como essas analises podem 
ser feitas (aqueles que pularam a segao teorica 
devem verificar a Tabela 14.1). 


5 Usuarios de versoes anteriores a 7.5 devem notar 
que a analise discriminante pode ser obtida utilizan- 
do o menu Statistics=>General Linear Model (ou 
ANOVA Models. como era conhecido na versao 
6) ^Multivariate... (Estatistica=>Modelos Lineares 
Generalizados=>Multivariada...) 


14.5 MANOVA NO SPSS © 

14.5.1 A analise principal © 

Carregue o arquivo OCD.sav ou insira 
os dados manualmente. Se voce entrar com 
os dados manualmente, ira precisar de tres 
colunas: uma coluna devera ser da variavel 
de codigo para os grupos (utilizei o seguinte: 
TCC (CBT) = 1, TC (BT) = 2, ST (NT) = 
3),* e nas duas colunas restantes entre com 
os escores para cada variavel dependente, 
respectivamente. Depois de digitar os dados, 
acesse a caixa de dialogo principal da MA¬ 
NOVA utilizando o menu Analyzes General 
LinearModel=>Multivariate ... 
(Analisar=>Modelos Lineares Generaliza- 
dos)=>Multivariada...) (veja aFigura 14.2). 

As ANOVAs (e varias comparacoes mul¬ 
tiplas) executadas apos a MANOVA principal 
sao o rnesmo que executar ANOVAs separadas 
no SPSS para cada variavel dependente. Con- 
sequentemente, a caixa de dialogo principal e 
as opcbes para a MANOVA sao muito seme- 
lhantes ao procedimento da ANOVA fatorial 


* N. de T.: As siglas entre parenteses sao as originais. 
Elas podem ser utilizadas caso voce decida usar o ar¬ 
quivo OCD.sav. 



Figura 14.2 Caixa de dialogo para a MANOVA. 
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que vimos no Capftulo 10. A principal diferen- 
5 a dessa caixa de dialogo e que o quadro De¬ 
pendent Variables (Variaveis Dependentes) 
tem espago para diversas variaveis. Selecione 
as duas variaveis dependentes da lista de varia¬ 
veis clicando em jJ. Selecione group (grupo) 
da lista de variaveis e transfira-a para o quadro 
Fixed Factor(s) (Fator(es) Fixo(s)) clicando 
em _J. Existe tambem um quadro em que voce 
pode colocar as covariaveis. Para essa analise, 
nao existem covariaveis, contudo, voce pode 
aplicar os princfpios da ANCOVA para o caso 
multivariado e depois realizar uma analise de 
covariancia multivariada (MANCOVA). De¬ 
pois de especificar as variaveis da analise, voce 
pode selecionar qualquer uma das outras caixas 
de dialogo clicando nos botoes no lado direito: 

| (Modelo) Esse botao abre uma caixa 
de dialogo para particularizar a ana¬ 
lise e selecionar o tipo de soma dos 
quadrados que sera utilizada (veja a 
Segao 10.3.2). 

] (Diagramas) Esse botao abre uma cai¬ 
xa de dialogo para selecionar diagra¬ 
mas de interacao. Essa opgao e util so- 
mente quando mais de duas variaveis 
independentes tenham sido mensura- 
das (veja a Segao 10.3.3). 
save | (Salvar) Esse botao abre uma caixa 
de dialogo para salvar os resfduos do 
MLG (isto e, diagnostics da regres- 
sao). Essas opgoes sao uteis para ve- 
rificar quao bem o modelo aderiu aos 
dados (veja o Capftulo 5). 

14.5.2 Comparagoes multiplas na 
MANOVA © 

A opgao padrao para dar prosseguimento a 
uma MANOVA e olhar para as ANOVAs univa- 
riadas individuals para cada variavel dependente. 
Para esses testes, o SPSS tem as mesmas opgoes 
que o procedimento da AN OVA univariada 
(veja o Capftulo 8 ). O botao c 0 '""* 11 (Contrastes) 
abre uma caixa de dialogo para especificar uma 
das varias opgoes de contrastes disponfveis para 
a(s) variavel(is) independente(s) na analise. A 


Tabela 8.6 descreve o que cada um desses testes 
compara, mas para esse exemplo e possfvel uti- 
lizar um simple (contraste simples) que compa¬ 
ra cada um dos grupos-experimentais ao grupo 
dos sem tratamento (controle). O grupo-controle 
(ST = Sem Tratamento) foi codificado como a 
ultima categoria (ele tem o codigo mais alto no 
editor de dados), assim, precisamos selecionar a 
variavel de grupo e mudar o contraste para um 
contraste simples utilizando a ultima categoria 
como a categoria de referenda (veja a Figura 
14.3). Para mais detalhes sobre contrastes, veja 
a Segao 8.2.10. 

Em vez de rodar um contraste, podemos 
executar testes post hoc na variavel indepen- 
dente para comparar cada grupo a todos os 
demais. Para acessar a caixa de dialogo para 
os testes post hoc, clique em p °» 1Boc . Essa cai¬ 
xa de dialogo e a mesma que para a ANOVA 
fatorial (veja a Figura 10.5) e a escolha do tes¬ 
te deve ter por base o mesmo criterio que foi 
visto na Segao 8.2.11. Para os objetivos desse 
exemplo, sugiro selecionar duas das minhas 
recomendagoes usuais: REGWQ e Games- 
Howell. Depois de selecionar os testes post 
hoc, retorne a caixa de dialogo principal. 

14.5.3 Opgoes adicionais © 

Para acessar a caixa de dialogo options 
(Opgoes), clique em na caixa de dialogo 
principal (veja a Figura 14.4). A caixa de dialogo 
resultante e semelhante a da ANOVA fatorial 
(veja a Segao 10.3.6); contudo, existem algumas 
opgbes adicionais que vale a pena mencionar. 



Figura 14.3 Contrastes para a(s) variavel(is) 
independente(s) na MANOVA. 
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Figura 14.4 Opgoes adicionais na MANOVA. 


• SSCP Matrices (Matrizes SSCP): Se 
essa opgao for selecionada, o SPSS pro- 
duzira uma matriz SSCP para o modelo, 
uma para os erros e uma do total. Essa op- 
gao pode ser util para entender os calculos 
da MANOVA. Contudo, se voce nao leu 
a segao teorica, nao selecione essa opgao 
e fique feliz por nao ter que se preocupar 
com essas matrizes! 

• Residual SSCP Matrix (Matriz SSCP re¬ 
sidual): Se essa opgao for selecionada, o 
SPSS ira apresentar uma matriz dos erros, 
uma dos erros das varancias-covariancias 
e uma dos erros das correlagoes. A matriz 
dos erros das variancias-covariancias e a 
matriz sobre a qual o teste de esfericidade 
de Bartlett e baseado. O teste de Barlett 
examina se a matriz e proporcional a ma¬ 
triz identidade (isto e, que as covariancias 
sao zero e as variancias - os valores ao 
longo da diagonal - sao aproximadamen- 
te iguais). 

As opgoes restantes sao as mesmas da 
ANOVA fatorial (e, dessa forma, foram descri- 
tas no Capitulo 10); recomendo reler esse capi- 
tulo antes de decidir quais sao as opgoes uteis. 


14.6 SAIDAS DA MANOVA ® 

14.6.1 Analise preliminar e checagem de 
hipoteses © 

A Saidal4.1 do SPSS mostra uma tabe- 
la inicial das estatisticas descritivas produzi- 
da clicando na opgao estatisticas descritivas 
(descriptives statistics) na caixa de dialogo 
opgSes (options) (Figura 14.4). Essa tabela 
contem as medias gerais dos grupos e os des- 
vios padrao para cada variavel dependente. Es¬ 
ses valores correspondem aqueles calculados 
manualmente na Tabela 14.1; olhando para 
essa tabela deve ficar claro o que essa parte da 
saida nos informa. Tambem e possfvel ver, a 
partir das medias, que os participantes tiveram 
muito mais pensamentos obsessivos do que 
comportamentos desse tipo. 

A Saida 14.2 do SPSS mostra o teste de 
Box para a hipotese de igualdade das matrizes 
de covariancias (veja a Segao 14.4.1). Essa es- 
tatistica testa a hipotese nula de que as matri¬ 
zes de variancias-covariancias sao as mesmas 
nos tres grupos. Portanto, se as matrizes sao 
iguais (e, dessa forma, a hipotese de homoge- 
neidade e satisfeita), essa estatfstica deve ser 
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Saida 14.1 do SPSS 


Descriptive Statistics (Estatisticas Descritivas) 



Group (Grupo) 

Mean 

(Media) 

Std. Deviation 
(Desvio Padrao) 

N 

Number of obsession-related 

CBT (TCC) 

13,40 

1,90 

10 

thoughts (Numero de pensamen- 

BT (TC) 

15.20 

2,10 

10 

tos obsessivos) 

No Treatment Control (Sem Tra- 
tamento - Controle) 

15,00 

2,36 

10 


Total (Total) 

14,53 

2,21 

30 

Number of obsession-related 

CBT (TCC) 

4,90 

1,20 

10 

behaviours (Numero de compor- 

BT (TC) 

3,70 

1,77 

10 

tamentos obsessivos) 

No Treatment Control (Sem Tra- 
tamento - Controle) 

5,00 

1,05 

10 


Total (Total) 

4,53 

1,46 

30 


Saida 14.2 do SPSS 


Box's Test of Equality of Covariance 
Matrices a (Teste de Box de Igualdade 
das matrizes de covariancias) 


Box's M (M de Box) 

9,959 

F 

1,482 

df\ (gll) 

6 

df2 (gl2) 

18169 

Sig. (Sig.) 

0,180 


a Delineamento: Intercepto + GRUPO) 


Bartlett's Test of Sphericity 3 
(Teste de Esfericidade de Bartllet) 


Likelihood Ratio (Razao de Verossimilhanga) 

0,042 

Approx. Chi-Square (Qui-Quadrado Aproxi- 

5,511 

mado) 


df (gl) 

2 

Sig. (Sig.) 

0,064 


a Delineamento: Intercepto + GRUPO) 


ndo-significativa. Para esses dados, p = 0,18 
(que e maior do que 0,05): assim, as matrizes 
de covariancias devem ser aproximadamente 
iguais e a hipotese e verificada. 

Se o valor do teste de Box for significati¬ 
ve (p < 0,05), as matrizes de covariancias sao 
significativamente diferentes e a hipotese de 
homogeneidade tera sido violada. O efeito da 
violagao dessa suposigao nao e clara. Hasks- 
tian, Roed e Lind (1979) relatam que o T 2 de 
Hotelling e robusto na situagao de dois gru- 
pos quando os tamanhos amostrais sao iguais. 
Como regra geral, se os tamanhos amostrais 
sao iguais, desconsidere o teste de Box, por- 


que ele e altamente instavel, e assuma que 
as estatisticas de Hotelling e Pillai sejam ro- 
bustas (veja a Segao 14.4.2). Contudo, se os 
tamanhos dos grupos forem diferentes, a ro- 
bustez nao pode ser assumida (especialmente 
se o teste de Box e significativo a p < 0,001). 
Quanto mais variaveis dependentes tenham 
sido mensuradas e quanto maior forem as 
diferengas nos tamanhos amostrais, mais dis- 
torcidos se tornarao os valores das probabi- 
lidades produzidos pelo SPSS. Tabachnick e 
Fidell (2001), contudo, sugerem que se amos- 
tras grandes produzem grandes variancias e 
covariancias, os valores probabillsticos serao 
conservadores (e as significances encon- 
tradas serao confiaveis). Contudo, se forem 
amostras pequenas que produzirem grandes 
variancias e covariancias, os valores probabi¬ 
llsticos serao liberais e, assim, as diferengas 
significativas devem ser tratadas com caute- 
la (entretanto, os efeitos nao-significativos 
podern ser confiaveis). Como tal, o teste de 
Box precisa de fato ser examinado quando os 
tamanhos amostrais diferem: nao devemos 
acreditar nele quando a normalidade mul- 
tivariada nao puder ser assumida (ou esteja 
sendo questionada), e as matrizes de varian- 
cias-covariancias de amostras devam ser ins- 
pecionadas para avaliar se as probabilidades 
apresentadas sao conservadoras ou liberais. 
Na situagao em que nao se pode acreditar nas 
probabilidades obtidas, existe muito pouco 
a ser feito exceto equalizar as amostras eli- 
minando casos ao acaso nos grupos maiores 
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(embora com essa perda de informagao ocor- 
ra tambem uma perda de poder). 

O teste de Bartlett de esfericidade testa se 
a hipotese de esfericidade foi satisfeita. Ele e 
util somente nos delineamentos univariados 
de medidas repetidas porque a MANOVA nao 
requer essa suposicao. 

14.6.2 Teste estatistico MANOVA ® 

A Saida 14.3 do SPSS mostra a tabela 
principal dos resultados. As estatisticas teste 
sao citadas para o intercepto do modelo (ate 
mesmo a MANOVA pode ser caracterizada 
como um modelo de regressao, embora como 
isso e feito esteja fora do escopo deste livro) e 
para a variavel de grupo. Para os nossos pro- 
positos, os efeitos de grupo sao de interesse 
porque eles nos informam se as terapias tive- 
ram ou nao um efeito sobre os pacientes com 
TOC (OCD). Voce vera que o SPSS lista as 
quatro estatisticas multivariadas e seus valores 
correspondem aqueles que foram calculados 
nas Segoes 14.3.4.2 e 14.3.4.5. Na proxima 
coluna, esses valores sao transformados em 
uma razao F. A coluna que realmente interes- 
sa, contudo, e aquela que content os valores 
das significancias das razoes F. Para esses da¬ 
dos, o traco de Pillai (p = 0,049), o lambda de 
Wilks (p = 0,050) e a maior raiz de Roy (p = 
0 ,020) alcangaram o criterio para significan- 
cia de 0,05. Entretanto, o traco de Hotelling (p 


= 0,051) e nao-significativo por esse criterio. 
Esse cenario e interessante, porque a estatis- 
tica teste que escolhemos determina se rejei- 
taremos ou nao a hipotese nula de que nao 
existem diferencas entre os grupos. Entretan¬ 
to, dado que sabemos sobre a significancia do 
traco de Pillai quando os tamanhos amostrais 
sao iguais, podemos acreditar no resultado 
dessa estatistica teste, que indica uma diferen- 
ga significativa. Esse exemplo destaca o poder 
associado a raiz de Roy (voce deve notar que 
essa estatistica tern uma significancia maior 
do que as demais) quando as suposigoes do 
teste foram satisfeitas. 

A partir desse resultado, provavelmente 
concluimos que o tipo de terapia empregado 
tern um efeito significativo no TOC (OCD). 
A natureza desse efeito nao esta clara a partir 
da estatistica teste multivariada. Primeiro, ela 
nada informa sobre quais grupos diferem de 
quais, segundo, nao diz nada sobre se o efeito 
da terapia foi nos pensamentos ou nos com- 
portamentos obsessivos ou na combinagao 
dos dois. Para determinar a natureza do efeito, 
o SPSS nos oferece os testes univariados. 

14.6.3 Teste estatistico Univariado © 

A Saida 14.4 do SPSS inicialmente mos¬ 
tra uma tabela resumo do teste de Levene de 
igualdade das variancias para cada variavel 
dependente. Esses testes sao os mesmos que 


Saida 14.3 do SPSS 


Multivariate Tests a (Testes Multivariados) 


Effect 

(Efeito) 

Value (Valor) 

Value 

(Valor) 

F 

Hypothesis 
df (Gl da 
Hipotese) 

Error df (Gl 
do Erro) 

Sig, 

(Sig.) 

Intercept 

PiHai's Trace (Trago de Pillai) 

0.983 

745.230° 

2.000 

26.000 

0.000 

(Intercepto) 

Wilks' Lambda (Lambda de Wilks) 

0.017 

745.230° 

2.000 

26.000 

0.000 


Hotelling's Trace (Trago de Hotelling) 

57.325 

745.230° 

2.000 

26.000 

0.000 


Roy Largest Root (Maior Raiz de Roy) 

57.325 

745.230° 

2.000 

26.000 

0.000 

GROUP 

PiHai's Trace (Trago de Pillai) 

0.318 

2.557 

4.000 

54.000 

0.049 

(Grupo) 

Wilks' Lambda (Lambda de Wilks) 

0.699 

2.555° 

4.000 

52.000 

0.050 


Hotelling's Trace (Trago de Hotelling) 

0.407 

2.546 

4.000 

50.000 

0.051 


Roy Largest Root (Maior Raiz de Roy) 

0.335 

4.520 

2.000 

27.000 

0.020 


a. Delineamento: Intercepto + GRUPO. 
b Calculado utilizando alfa = 0,05. 
c Estatistica exata. 
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Saida 14.4 do SPSS 

Levene's Test of Equality of Error Variances a 
(Teste de Levene para a Igualdade das Variancias dos Erros) 



F 

dfl (gll) 

df2 (gl2) 

Sig, (Sig.) 

Number of obsession-related thoughts (Nu- 
mero de pensamentos obsessivos) 

0.76 

2 

27 

0.927 

Number of obsession-related behaviours 
Numero de comportamentos obsessivos) 

1.828 

2 

27 

0.180 


Testa a hipotese de que as variancias dos erros da variavel dependente sao iguais entre os grupos. 
a Delineamento: Intercepto + GRUPO. 


Tests of Between-Subjects Effects (Testes dos efeitos entre participantes) 




Type III Sum of 


Mean 





Squares (Soma 


Square 



Source 


dos Quadrados 

r If 

(Media dos 


Sig. 

(Fonte) 

Dependent Variable (Variavel Dependente) 

do Tipo III) 

(gi) 

Quadrados) 

F 

(Sig) 

Corrected 

Number of obsession-related thoughts (Nu- 

19.467 b 

2 

9.733 

2.154 

0.136 

Model 

mero de pensamentos obsessivos) 






(Modelo 

Number of obsession-related behaviours (Nu- 

10.467 c 

2 

5.233 

2.771 

0.080 

Corrigido) 

mero de comportamentos obsessivos) 






Intercept 

Number of obsession-related thoughts (Nu- 

6336.533 

1 

6336.533 

1402.348 

0.000 

(Intercepto) 

mero de pensamentos obsessivos) 

Number of obsession-related behaviours (Nu- 

616.533 

1 

616.533 

326.400 

0.000 


mero de comportamentos obsessivos) 






GROUP 

Number of obsession-related thoughts (Nu- 

19.467 

2 

9.733 

2.154 

0.136 

(Grupo) 

mero de pensamentos obsessivos) 

Number of obsession-related behaviours (Nu- 

10.467 

2 

5.233 

2.771 

0.080 


mero de comportamentos obsessivos) 






Error (Erro) 

Number of obsession-related thoughts (Nu- 

122.000 

27 

4.519 




mero de pensamentos obsessivos) 

Number of obsession-related behaviours (Nu- 

51.000 

27 

1.889 




mero de comportamentos obsessivos) 






Total (Total) 

Number of obsession-related thoughts (Nu- 

6478.000 

30 





mero de pensamentos obsessivos) 

Number of obsession-related behaviours (Nu- 

678.000 

30 





mero de comportamentos obsessivos) 






Corrected 

Number of obsession-related thoughts (Nu- 

141.467 

29 




Total (Total 

mero de pensamentos obsessivos) 






Corrigido) 

Number of obsession-related behaviours (Nu- 

61.467 

29 





mero de comportamentos obsessivos) 







a Calculado utilizando alfa = 0,05. 
b R ao quadrado = 0.138 (R ao quadrado ajustado = 0,074). 
c R ao quadrado = 0.170 (R ao quadrado ajustado = 0,109). 


seriam encontrados se uma ANOVA de um 
fator tivesse sido realizada em cada variavel 
dependente (veja o Capitulo 8). O teste de 
Levene deve ser nao-significativo para todas 
as variaveis dependentes se as suposigoes de 
homogeneidade das variancias forem validas. 


Os resultados para esses dados mostram cla- 
ramente que as suposicdes foram satisfeitas. 
Esse resultado nao apenas nos da confianga 
nos testes univariados que seguem, mas tam- 
bem reforga a ideia de que a estatistica teste 
multivariada e robusta. 
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A proxima parte da safda contem uma 
tabela resumo da ANOVA para as variaveis 
dependentes. A linha de interesse e a deno- 
minada GROUP (Grupo) (voce notara que os 
valores nessa linha sao os mesmos da linha 
Corrected Model (Modelo Corrigido); isto e, 
porque o modelo ajustado aos dados contem 
somente uma variavel independente: group 
(grupo)). A linha GROUP (GRUPO) contem 
um resumo da ANOVA para cada uma das 
variaveis dependentes que sao valores para a 
soma dos quadrados tanto para agoes ( actions ) 
quanto para pensamentos ( thoughts ) (esses 
valores correspondem aos valores do SS M 
calculado nas Segoes 14.3.3.1 e 14.3.3.2, res- 
pectivamente). A linha rotulada Error (Erro) 
contem informagoes sobre a soma dos resf- 
duos dos quadrados e a media dos quadrados 
pra cada uma das variaveis dependentes: esses 
valores do SS R foram calculados nas Segoes 

14.3.3.1 e 14.3.3.2; retorne a essas segoes para 
confirmar o significado desses valores. A linha 
Corrected Total (Total Corrigido) contem os 
valores da soma total dos quadrados para cada 
variavel dependente (novamente, esses valo¬ 
res SS T foram calculados nas Segoes 14.3.3.1 
e 14.3.3.2). As partes importantes dessa tabela 
sao as colunas denominadas F e Sig. nas quais 
as razoes F para cada ANOVA univariada e o 
valor das suas significancias sao apresentados. 
O que deve estar claro na Saida 14.4 do SPSS 
e nos calculos feitos nas Segbes 14.3.3.1 e 

14.3.3.2 e que os valores associados com as 
ANOVAs univariadas realizadas apos a MA- 
NOVA sao identicos aos valores obtidos na 
ANOVA de um fator que foi realizada em 
cada variavel dependente. Esse fato ilustra 
que a MANOVA oferece somente uma prote- 
gao hipotetica sobre a inflagao da taxa de erro 
do Tipo I: nao existe um ajustamento real que 
possa ser feito nos valores obtidos. 

Os valores de p na Saida 14.4 do SPSS in¬ 
dicam que existe uma diferenga nao-significa- 
tiva entre os grupos de terapia tanto em termos 
de pensamentos obsessivos (p = 0,136) quan¬ 
to de comportamentos obsessivos (p = 0,080). 
Esses dois resultados nos levam a concluir que 
nao e posslvel afirmar que o tipo de terapia 


tenha um efeito significativo nos nfveis de 
TOC (OCD) experimentado pelos pacientes. 
Voces podem ter notado algo estranho nesse 
exemplo: o teste estatfstico multivariado nos 
levou a concluir que a terapia tern um impac- 
to significativo no TOC, enquanto os resulta¬ 
dos univariados indicam que a terapia nao foi 
bem-sucedida. Antes de continuar, pense um 
pouco sobre o porque disso ocorrer. 

A razao desse tipo de resultado e simples: 
o teste multivariado leva em conta as corre- 
lagoes entre as variaveis dependentes, assim, 
para esses dados ele tem mais poder para de- 
tectar diferengas entre os grupos. Com esse 
conhecimento em mente, os testes univariados 
nao sao uteis para interpretagao, porque os 
grupos diferem por uma combinagao das va¬ 
riaveis dependentes. Para ver como variaveis 
dependentes interagem, precisamos realizar 
uma analise da fungao discriminante, que sera 
descrita na Segao 14.7. 

14.6.4 Matrizes SSCP © 

Se voce selecionou as duas opgoes para 
obter matrizes SSCP (Segao 14.5.3), o SPSS 
produzira as tabelas mostradas na Safda 14.5 
do SPSS e na Safda 14.6 do SPSS. A primeira 
tabela (Safda 14.5 do SPSS) mostra a SSCP do 
modelo (H), denominada Hypothesis GROUP 
(Hipoteses de GRUPO) (utilizei um sombrea- 
mento para destacar essa matriz), e a SSCP 
erro (E), rotulada de Error (Erro) (utilizei um 
sombreamento mais forte para destacar essa 
matriz). A matriz para o intercepto tambem 
e mostrada, mas essa matriz nao e importan- 
te para os nossos propositos. Deve estar bem 
claro que os valores nas matrizes do modelo 
e do erro apresentadas na Safda 14.5 do SPSS 
correspondem aos valores que calculamos nas 
Segoes 14.3.3.6 e 14.3.3.5, respectivamente. 
Essas matrizes sao uteis, portanto, para com- 
preender o padrao dos dados, especialmen- 
te se olharmos para os valores dos produtos 
cruzados que indicam o relacionamento entre 
as variaveis dependentes. Nesse exemplo, os 
valores da matriz SSCP, somas dos quadrados 
para os erros, sao substancialmente maiores 
do que os valores da matriz SSCP modelo (ou 
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Saida 14.5 do SPSS 

Between-Subjects SSCP Matrix (Matriz SSCP entre participantes) 





Number of 





obsession-related 

Number of obsession- 




behaviours (Numero 

related thoughts 




de comportamentos 

(Numero de pensamentos 




obsessivos) 

obsessivos) 

Hypotesis 

Intercept 

Number of obsession-related 

616.533 

1976.533 

(Hipotese) 

(Intercepto) 

behaviours (Numero de compor- 
tamentos obsessivos) 





Number of obsession-related 

1976.533 

6336.533 



thoughts (Numero de pensa- 
mentos obsessivos) 




GROUP 

Number of obsession-related 

10.467 

-7.533 


(Grupo) 

behaviours (Numero de compor- 
tamentos obsessivos) 





Number of obsession-related 

-7.533 

19.467 



thoughts (Numero de pensa- 
mentos obsessivos) 



Error (Erro) 


Number of obsession-related 

51.000 

13.000 



behaviours (Numero de compor- 
tamentos obsessivos) 





Number of obsession-related 

13.000 

122.000 



thoughts (Numero de pensa- 
mentos obsessivos) 




Com base na soma dos quadrados to Tipo III. 


Saida do SPSS 14.6 

Residua! SSCP Matrix (Matriz SSCP Residual) 




Number of 
obsession-related 
behaviours (Numero 
de comportamentos 
obsessivos) 

Number of 
obsess/on-related 
thoughts (Numero 
de pensamentos 
obsessivos) 

Sum-of-Squares and 
Cross-Products (Soma 

Number of obsession-related behaviours (Nu¬ 
mero de comportamentos obsessivos) 

51.000 

13.000 

dos quadrados dos pro- 
dutos cruzados) 

Number of obsession-related thoughts (Nu¬ 
mero de pensamentos obsessivos) 

13.000 

122.000 

Covariance 

(Covariancia) 

Number of obsession-related behaviours (Nu¬ 
mero de comportamentos obsessivos) 

1.889 

0.481 


Number of obsession-related thoughts (Nu¬ 
mero de pensamentos obsessivos) 

0.481 

4.519 

Correlation (Correlapao) 

Number of obsession-related behaviours (Nu¬ 
mero de comportamentos obsessivos) 

1.000 

0.165 


Number of obsession-related thoughts (Nu¬ 
mero de pensamentos obsessivos) 

0.165 

1.000 


Com base na soma dos quadrados to Tipo III. 


grupo), enquanto os valores absolutos dos pro- 
dutos cruzados sao bem parecidos. Esse pa- 
drao sugere que se a MANOVA e significativa: 


portanto, talvez o relacionamento entre as va- 
riaveis dependentes seja importante, e nao as 
variaveis dependentes individualmente. 
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A Saida 14.6 do SPSS mostra a matriz 
SSCP residual novamente, mas dessa vez ela 
inclui a matriz de variancias-covariancias e a 
matriz das correlagoes. Essas matrizes estao 
todas relacionadas. Se voce voltar ao Capitulo 
4, vera que a covariancia e calculada pela divi- 
sao do produto cruzado pelo numero de obser- 
vagoes (isto e, a covariancia e a media dos pro- 
dutos cruzados). Da mesma forma, a variancia 
e calculada pela divisao das somas dos quadra- 
dos pelo numero de graus de liberdade (e, as- 
sim, de forma semelhante representa a media 
da soma dos quadrados). Por conseguinte, a 
matriz de variancias-covariancias representa a 
forma media da matriz SSCP. Finalmente, vi- 
mos no Capitulo 4 que a correlagao era uma 
versao padronizada da covariancia (onde o 
desvio padrao e tambem levado em considera- 
gao), assim, a matriz de correlagoes representa 
a forma padrao da matriz de variancias-cova¬ 
riancias. Como ocorreu com a matriz SSCP, 
essas outras matrizes sao uteis para determinar 
a extensao do erro do modelo. 

A matriz de variancias-covariancias e es- 
pecialmente util porque o teste de esfericida- 
de de Bartlett e baseado nessa matriz. O teste 
de Bartlett verifica se a matriz e proporcional 
a uma matriz identidade. Na Segao 14.3.1, 
vimos que na matriz identidade os elemen- 
tos da diagonal sao iguais a 1 e os fora da 
diagonal sao 0. Entretanto, o teste de Bartlett 
testa se os elementos da diagonal da matriz 
de variancias-covariancias sao iguais (isto e, 
as variancias dos grupos sao as mesmas) e se 
os elementos fora da diagonal sao aproxima- 
damente zero (isto e, as variaveis dependen- 
tes nao estao correlacionadas). Nesse caso, 
as variancias sao bastante diferentes (1,89 
comparado com 4,52) e as covariancias sao 
levemente diferentes de zero (0,48); assim, o 
teste de Bartlett deve apresentar um resulta- 
do significativo (veja a Saida 14.2 do SPSS). 
Embora essa discussao seja irrelevante para 
os testes multivariados, espero que com ela 
voce possa relacionar essas ideias com as 
questoes de esfericidade apresentadas no Ca- 
pftulo 11 e ver com maior clareza como essa 
hipotese e testada. 


14.6.5 Contrastes ® 

Na Segao 14.5.2, sugeri a realizagao de 
contrastes simples ( simple ) que comparam 
cada um dos grupos submetidos a terapia com 
o grupo-controle (nao tratados). A Saida 14.7 
do SPSS mostra os resultados desses contras¬ 
tes. Essa tabela esta dividida em duas segoes 
denominadas Level 1 vs. Level 3 (Nivel 1 vs. 
Nivel 3) e Level 2 vs. Level 3 (Nivel 2 vs. Nivel 
3), onde os numeros correspondem aos codi- 
gos da variavel de grupo (isto e, 1 representa o 
codigo mais baixo utilizado no editor de dados 
e 3, o mais alto). Se voce codificou a variavel 
de grupo utilizando os mesmos valores que 
eu, entao esses contrastes representam TCC 
vs. ST (CBT vs. NT) e TC vs. ST (BT vs. NT), 
respectivamente. Cada contraste e executado 
nas duas variaveis dependentes separadamen- 
te e, assim, eles sao identicos aos contrastes 
que seriam obtidos de uma ANOVA univaria- 
da. Essa tabela fornece valores para a estima- 
tiva dos contrastes e o valor hipotetico (que 
sera sempre zero porque estamos testando a 
hipotese nula de que a diferenga entre grupos 
e zero). A diferenga estimada observada e en¬ 
tao testada para ver se ela e significativamente 
diferente de zero tendo por base o erro padrao 
(voce podera reler os Capitulos 1 e 7 para ver 
alguma teoria nesse tipo de teste de hipoteses). 
Um intervalo de 95% de confianca e produzi- 
do para a diferenga estimada. 

A partir dos valores da Sig ., voce deve ter 
notado que quando comparamos TCC com ST 
(CBT com NT), nao existem diferengas nos 
pensamentos (p = 0,104) ou comportamentos 
(p = 0,872) porque os dois valores estao aci- 
ma do ponto de corte que e, nesse caso, 0,05. 
Contudo, comparando TC com ST (BT com 
NT), nao existe diferengas em pensamentos (p 
= 0,835), mas existe uma diferenga significa- 
tiva nos comportamentos entre os grupos (p = 
0,044, que e menor que 0,05). Os intervalos de 
confianga confirmam esses achados: vimos an- 
teriormente que um intervalo de 95% de con¬ 
fianga que deve conter a verdadeira diferenga 
entre os grupos em 95% das vezes. Se esses 
limites cruzarem zero (isto e, o inferior e um 
numero negativo e o superior, positivo), isso 



Descobrindo a Estatistica Usaimdo o SPSS 541 


Saida 14.7 do SPSS 

Contrast Results (K Matrix) (Resultados dos Contrastes - Matriz K) 



Dependent Variable (Variavel dependente) 


Number of 

Number of 

Group Simple 

obsession-related 

obsession-related 

Constrast 

thoughts (Numero 

behaviours (Numero 

(Constrastes simples 

de pensamentos 

de comportamentos 

entre os grupos) 

obsessivos) 

obsessivos) 

Level 1 vs. Level 3 Contrast Estimate (Estimativa do Contraste) 

-1.600 

-0.100 

(Nivel 1 vs. Nivel 3) Hypothesized Value (Valor Hipotetico) 

0 

0 

Difference (Estimate - Hypothesized) (Dife- 

-1.600 

-0.100 

renga (Estimativa - Hipotetico)) 



Std. Error (Erro Padrao) 

0.951 

0.615 

Sig (Sig.) 

0.104 

0.872 

95% Confidente Interval Lower Bound 

-3.551 

-1.361 

for Difference (Intervalo (Limite Inferior) 



de 95% de Confianga para Upper Bound (Li- 

0.351 

-1.161 

a Diferenga) mite Superior) 



Level 1 vs. Level 3 Contrast Estimate (Estimativa do Contraste) 

0.200 

-1.300 

(Nivel 1 vs. Nivel 3) Hypothesized Value (Valor Hipotetico) 

0 

0 

Difference (Estimate - Hypothesized) (Dife- 

0.200 

-1.300 

renga (Estimativa - Hipotetico)) 



Std. Error (Erro Padrao) 

0.951 

0.615 

Sig (Sig.) 

0.835 

0.044 

95% Confidente Interval Lower Bound 

-1.751 

-2.561 

for Difference (Intervalo (Limite Inferior) 



de 95% de Confianga para Upper Bound (Li- 

2.151 

-0.039 

a Diferenga) mite Superior) 




a Reference category = 3 (Categoria de referenda = 3). 


C~ —; — 

Dica da Samanta Ferrinho 





V 


• A MANOVA e utilizada para testar diferengas entre grupos com diversas varia- 
veis dependentes simultaneamente. 

• 0 teste de Box verifies a hipotese da igualdade das matrizes de covariancias. 
Esse teste pode ser ignorado quando os tamanhos amostrais sao os mesmos, 
pois quando isso acontece a MANOVA e robusta a violagoes dessa hipotese. 
Se os tamanhos dos grupos diferem, esse teste deve ser considerado. Se 
o valor da Sig. for menor do que 0,001, os resultados da analise nao sao 
confiaveis (veja a Segao 14.6.1). 

• A tabela Testes Multivariados (Multivariate Tests) apresenta os resultados da 
MANOVA. Existem quatro estatisticas testes listadas (Trago de Pillai, Lambda 
de Wilks, Trago de Hotelling e Maior Raiz de Roy). Recomendo a utilizagao do 
trago de Pillai. Se o valor da Sig. dessa estatistica for menor que 0,05, os gru¬ 
pos diferem significativamente em relagao as variaveis dependentes. 

• Testes ANOVA podem ser utilizados para dar seguimento a MANOVA (uma 
ANOVA diferente para cada variavel dependente). Os resultados desses testes 
estao listados na tabela Testes de Efeitos Entre Participantes (Tests of Between- 
Subjects Effects). Essas ANOVAs podem, por sua vez, serem complementadas 
pela utilizagao de contrastes (veja os Capitulos 8 a 12). Pessoalmente, nao re¬ 
comendo essa abordagem e sugiro que seja feita uma analise discriminante. 
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nos informa que o valor da verdadeira diferen- 
qa pode ser zero (ou seja, nao existira diferenca 
entre os grupos). Entretanto, nao podemos es- 
tar confiantes de que a diferenqa entre grupos 
observada e significativa porque a verdadeira 
diferenca entre os grupos na populagao pode 
ser zero. Se, entretanto, o intervalo de confian- 
qa nao contem o zero (isto e, os dois limites ou 
sao positivos ou negativos), podemos ficar con¬ 
fiantes de que o verdadeira valor da diferenqa 
entre grupos e diferente de zero. Desse modo, 
podemos estar certos de que existe uma dife- 
renga genufna entre os grupos. Para esses da¬ 
dos, todos os intervalos de confianga incluem 
o zero (os limites inferiores sao negativos e os 
superiores sao positivos), exceto para o con- 
traste TC versus ST para comportamentos; as- 
sim somente esse contraste e significativo. Isso 
e inesperado, pois a ANOVA univariada para 
comportamentos nao foi significativa e, assim, 
nao esperavamos que existisse alguma diferen- 
qa entre os grupos. 

14.7 MANOVA ADICIONAL COM 
ANALISE DISCRIMINANTE ® 

Mencionei anteriormente que uma MA¬ 
NOVA significativa pode ser seguida pela 
utilizaqao tanto de ANOVAs univariadas 
quanto da analise discriminante. No exem- 
plo deste capitulo, as ANOVAs univariadas 
nao foram uma forma util de verificar o que 


o teste multivariado estava mostrando porque 
o relacionamento entre as variaveis dependen- 
tes obviamente foi responsavel pelo efeito. 
Entretanto, esses dados foram projetados es- 
pecificamente para ilustrar como as ANOVAs 
univariadas devem ser tratadas com cautela e, 
na vida real, e bem provavel que uma MANO¬ 
VA significativa seja acompanhada de pelo 
menos uma ANOVA significativa. Contudo, 
isso nao significa que o relacionamento entre 
as variaveis dependentes nao seja importante, 
e ele e ainda vital para investigar a natureza do 
relacionamento. A analise discriminante e a 
melhor maneira de obter isso, e eu recomendo 
que voce de prosseguimento a uma MANOVA 
tanto com os testes univariados quanto com 
uma analise discriminante se quiser entender 
os seus dados totalmente. 

E simples realizar uma analise discriminante 
no SPSS: acesse a caixa de dialogo principal pelo 
caminho Analyze=> Classify=>Discriminant... 
(Analisar=>Classificar=>Discriminante...) (veja 
aFigura 14.5). 

A caixa de dialogo principal ira listar as 
variaveis no editor de dados no lado esquerdo 
e apresentar dois espagos no direito: um para 
a variavel de grupo e outro para as previsoras. 
Na analise discriminante, tentamos separar 
(ou discriminar) um conjunto de grupos uti- 
lizando varios previsores (assim, e mais ou 
menos como uma regressao logfstica, mas 
onde existem varios grupos em vez de ape- 



Figura 14.5 Caixa de dialogo principal para a analise discriminante. 
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nas dois). 6 Pode ser confuso pensar agoes e 
pensamentos como variaveis independentes 
(mesmo porque elas eram variaveis depen- 
dentes na MANOVA!), por isso estou me re- 
ferindo a elas como previsores - essa e outra 
razao para nao rotular as variaveis como de- 
pendentes e independentes em uma analise de 
correlagao. 

Para executar a analise, selecione a varia- 
vel group (grupo) e transfira-a para o quadro 
Grouping Variable (Variavel de Grupo) cli- 
cando em _d. Uma vez que essa variavel tenha 
sido transferida, o botao (Definir inter- 
valo...) se tornara ativo e voce devera clica-lo 
para obter a caixa de dialogo na qual podera 
especificar os valores extremos dos codigos 
utilizados (1 e 3, nesse caso). Uma vez que 
os codigos utilizados pela variavel de grupo 
tenham sido especificados, voce deve selecio- 
nar as variaveis actions (agoes) e thoughts 
(pensamentos) e transferi-las para a caixa 
Independents (Independentes) clicando em 
_cJ. Existem duas opgoes disponfveis para de- 
terminar como os previsores sao fornecidos 
ao modelo. O Default (Padrao) e que ambos 
sejam colocados juntos e essa e a opgao que 
precisamos (porque na MANOVA as variaveis 
dependentes sao analisadas simultaneamente). 
E possfvel entrar com as variaveis dependen¬ 
tes passo a passo (Stepwise), e se essa opgao 
estiver selecionada, o botao se tornara 

ativo, o que abrira a caixa de dialogo para es¬ 
pecificar um criterio de entrada para os pre¬ 
visores. Para prosseguir com a MANOVA, 
precisamos somente estar preocupados com 
as opgoes restantes. 

Clique em sn»»bo (Estatfsticas) para ati- 
var a caixa de dialogo semelhante a da Figu- 
ra 14.6. Essa caixa de dialogo nos permite 
requerer o calculo das medias dos grupos, a 
ANOVA univariada e o teste de Box da igual- 
dade das matrizes de covariancias, todos ja 


6 Eu poderia ter apresentado a analise discriminante no 
Capi'tulo 6 em vez da regressao logfstica porque elas sao 
maneiras diferentes de chegar aos mesmos resultados. 
Entretanto, a regressao logfstica tem algumas hipoteses 
restritivas e e geralmente mais robusta, por isso apre- 
sentei a analise discriminante somente neste capi'tulo. 



Figura 14.6 Opgoes para a analise discrimi¬ 
nante. 


fornecidos na safda da MANOVA (assim, nao 
precisamos solicita-los novamente). Alem 
disso, podemos solicitar as correlagoes entre 
grupos e as matrizes de covariancias, que sao 
as mesmas correlagoes residuais e a matriz 
de covariancia vistas na Safda 14.6 do SPSS. 
Existe, tambem, uma opcao para apresentar 
uma matriz de covariancias para grupos se- 
parados, que pode ser util para entender o re- 
lacionamento entre as variaveis dependentes 
para cada grupo (essa matriz e um resultado 
que a MANOVA nao fornece e recomendo 
seleciona-la). Finalmente, podemos solicitar a 
matriz de covariancias total, que apresenta as 
variancias e covariancias de todas as variaveis 
dependentes. Outra opgao util e selecionar os 
coeficientes nao-padronizados (Unstandardi¬ 
zed) da funcao. Essa opcao ira produzir os bs 
nao-padronizados para cada CL (Combinacao 
Linear - Variate) (veja a Equagao (14.5)). 
Quando voce tiver terminado com essa caixa 
de dialogo, clique em (Continuar) para 
retornar a caixa de dialogo principal. 

Se voce clicar em ■! (Classificar), tera 
acesso a uma caixa de dialogo semelhante a 
da Figura 14.7. Esse local apresenta varias 
opgoes disponfveis. Primeiro, voce pode se¬ 
lecionar como as probabilidades a priori sao 
determinadas: se os tamanhos dos grupos fo- 
rem os mesmos, voce nao deve alterar os valo¬ 
res padrao que sao apresentados; contudo, se 
voce tem um delineamento nao-balanceado, e 
recomendavel basear as probabilidades a prio¬ 
ri nos tamanhos dos grupos observados. A op- 
gao por omissao (Default) para realizar a ana- 
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Figura 14.7 Opgoes de classificagao para a analise discriminante. 


lise da matriz de covariancias dentro do grupo 
e boa (porque essa e a matriz sobre a qual a 
MANOVA esta baseada). Devemos, tambem, 
requerer os diagramas de grupos combinados, 
que irao apresentar graficos separados da CLs 
para cada participante agrupados de acordo 
com a terapia que receberam. O diagrama 
dos grupos separados mostra a mesma coisa, 
mas utilizando graficos diferentes para cada 
um dos grupos; quando o numero de grupos 
e pequeno, e melhor selecionar um diagrama 
combinado porque ele e mais facil de interpre¬ 
tar. As opgoes restantes sao de pouco interesse 
quando analise discriminante e utilizada como 
um prosseguimento da MANOVA. A unica 
opgao util e a tabela resumo, que fornece uma 
medida geral de quao bem as combinacoes li- 
neares (CL) discriminantes classificam os par- 
ticipantes reais. Quando voce tiver terminado 


com as opgoes, clique em c ° n ‘~* para retornar a 
caixa de dialogo principal. 

As opgoes finais podem ser acessadas 
clicando em S 0 ” (Salvar) para acessar uma 
caixa de dialogo semelhante a da Figura 14.8. 
Existem tres opgoes disponfveis, duas das quais 
estao relacionadas as probabilidades e a que 
grupo os valores previstos pertencem. Esses 
valores sao comparaveis aqueles obtidos com 
a analise de regressao logistica (veja o Capftulo 
6 ). A opgao final e o fornecimento dos esco- 
res discriminantes. Esses sao os escores para 
cada pessoa, em cada CL (variate), obtidos a 
partir da equagao (14.5). Esses escores podem 
ser uteis porque as CLs que a analise identifica 
podem representar construtos sociais ou psi- 
cologicos subjacentes. Se esses construtos sao 
identificaveis, para interpreta-los e util saber o 
escore de cada participante em cada dimensao. 



Figura 14.8 Caixa de dialogo Save new variables (Salvar novas variaveis) da analise discrimi¬ 
nante. 
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14.8 SAIDAS DA ANALISE 
DISCRIMINATE © 

A Saida 14.8 do SPSS mostra as matrizes 
de covariancia para grupos separados (sele- 
cionadas na Figura 14.6) Essas matrizes sao 
constrmdas com as variancias de cada variavel 
dependente para cada grupo (esses valores sao 
mostrados na Tabela 14.1). As covariancias sao 
obtidas tomando o produto cruzado entre as va- 
riaveis dependentes para cada grupo (mostrados 
na Tabela 14.4 como 0,40, 22,6 e —10) e divi- 
dindo cada um por 9 (os graus de liberdade), 
N- 1 (onde JVe o numero de observances). Os 
valores dessa tabela sao uteis porque eles nos 
dao uma ideia de como o relacionamento entre 
as variaveis dependentes muda de grupo para 
grupo. Por exemplo, no grupo TCC, os compor- 
tamentos e pensamentos nao tern praticamente 
relacionamento linear porque a covariancia e 
praticamente zero. No grupo TC, pensamen¬ 
tos e agoes estao positivamente relacionados, 
assim, quando o numero de comportamentos 
diminui, o mesmo ocorre com os pensamen¬ 
tos. Na condigao ST (Sem Tratamento), existe 
um relacionamento negativo, desse modo, se o 
numero de pensamentos aumenta, o numero de 
comportamentos (agoes) diminui. E importante 
notar que essas matrizes nao informam sobre 


a importancia do relacionamento porque elas 
nao estao padronizadas (veja o Capitulo 4); elas 
apenas fornecem uma indicagao basica. 

A Saida 14.9 do SPSS mostra as estatisti- 
cas iniciais da analise discriminante. Primei- 
ro conhecemos os autovetores para cada CL 
(variate), e voce deve notar que os valores 
correspondem aos valores dos elementos da 
diagonal da matriz HE' 1 (calculados no arqui- 
vo AppendixChapterl4.pdf, disponivel no 
site www.artmed.com.br). Esses autovetores 
sao convertidos em percentuais da variancia 
da CL e a primeira delas e responsavel por 
82,2% da variancia comparada com a segunda 
CL, responsavel por apenas 17,8%. A proxima 
parte da saida mostra o lambda de Wilks, que 
tern o mesmo valor (0,699), os graus de liber¬ 
dade (4) e o valor da significancia (0,05) como 
na MANOVA (veja a Saida 14.3 do SPSS). O 
ponto importante a ser destacado dessa tabela 
e que somente uma das CLs ( variates ) e sig- 
nificativa (a segunda nao e significativa, p = 
0,173). Portanto, as diferengas entre os grupos 
mostradas pela MANOVA podem ser explica- 
das em termos de apenas uma dimensao sub- 
jacente. 

As tabelas da Saida 14.10 do SPSS sao 
as mais importantes para interpretagao. A 
primeira tabela mostra os coeficientes padro- 


Saida 14.8 do SPSS 

Covariance Matrices (Matrizes de Covariancia) 


Group (Grupo) 


Number of 
obsession-related 
behaviours (Numero 
de comportamentos 
obsessivos) 

Number of 
obsession-related 
thoughts (Numero 
de pensamentos 
obsessivos) 

ce7"(Tcc) 

Number of obsession-related behaviours (Nu¬ 
mero de comportamentos obsessivos) 

1.433 

4.4444E-02 


Number of obsession-related thoughts (Numero 
de pensamentos obsessivos) 

4.444E-02 

3.600 

BT (TC) 

Number of obsession-related behaviours (Nu¬ 
mero de comportamentos obsessivos) 

3.122 

2.511 


Number of obsession-related thoughts (Numero 
de pensamentos obsessivos) 

2.511 

4.400 

No Treatment 
Control (Sem 

Number of obsession-related behaviours (Nu¬ 
mero de comportamentos obsessivos) 

1.111 

-1.111 

Tratamento Con¬ 
sole) 

Number of obsession-related thoughts (Numero 
de pensamentos obsessivos) 

-1.111 

5.556 










546 Andy Field 


Saida 14.9 do SPSS 


Eingenvalues (Autovalores) 


Function 

Eingenvalue 

% of Variance 

Cumulative % 

Canonical Correlation 

(Fungao) 

(Autovalor) 

(% da Variancia) 

(% Acumulado) 

(Correlagao Canonica) 

i 

0.335 a 

82.2 

82.2 

0.501 

2 

0.073 a 

17.8 

100.0 

0.260 


a As primeiras duas fungoes discriminantes canonicas foram utilizadas na analise. 


Wilks's Lambda (Lambda de Wilks) 


Test of Function (s) 

Wilks's Lambda 

Chi-square 

df 

Sig. 

(Teste de Fungao(oes)) 

(Lambda de Wilks) 

(Qui-quadrado) 

(gi) 

(Sig.) 

1 through 2 (1 ate 2) 

0.699 

9.508 

4 

0.050 

2 

0.932 

1.856 

1 

0.173 


Saida 14.10 do SPSS 


Standardized Canonical Discriminant Function 
Coefficients (Coeficientes padronizados 
da fungao discriminante canonical 



Function (Fungao) 


1 

2 

Number of obsession-related 
behaviours (Numero de com¬ 
portamentos obsessivos) 

0.829 

0.584 

Number of obsession-related 
thoughts (Numero de pensa¬ 
mentos obsessivos) 

-0.713 

0.721 


Structure Matrix (Matriz de Estrutura) 



Function (Fungao) 


1 

2 

Number of obsession-related 
thoughts (Numero de pen- 

0.711* 

0.703 

samentos obsessivos) 

Number of obsession-related 
behaviours (Numero de compor¬ 
tamentos obsessivos) 

-0.576 

0.817* 


Correlagoes entre grupos agrupadas entre variaveis discri¬ 
minantes e fungoes discriminantes canonicas padroniza- 
das Variaveis ordenadas pelas correlagoes absolutas entre 
cada variavel e cada fungao discriminante. 

* Maior correlagao absoluta entre cada variavel e cada 
fungao discriminantes. 


nizados da fungao discriminante para as duas 
CLs. Esses valores sao versoes padronizadas 
dos valores dos autovetores calculados na 
Segao 14.3.4.1. Lembre que as CLs podem 
ser expressas em termos de uma equagao de 
regressao linear (veja a Equagao (14.4)) e os 
coeficientes padronizados da fungao discrimi¬ 
nante sao equivalentes aos betas padronizados 
da regressao. Por conseguinte, esses coefi¬ 
cientes nos informam a contribuigao relativa 
de cada variavel para a CL. Esta claro, a partir 
do tamanho dos valores para esses dados, que 
o numero de comportamentos obsessivos tem 
uma contribuigao maior para a primeira CL 
do que o numero de pensamentos, mas que 
o contrario e verdadeiro para a segunda CL. 
Tambem, lembrando que os coeficientes beta 
padronizados variam no intervalo de — 1 a 1, 
vale notar que as duas variaveis tem uma gran¬ 
de contribuigao para a primeira CL (isto e, am- 
bas sao importantes) porque seus valores estao 
proximos de 1 e — 1, respectivamente. Tendo 
em mente que somente a primeira CL e impor- 
tante, podemos concluir que e necessario reter 
as duas variaveis dependentes no conjunto de 
discriminadores (porque suas ponderagoes pa¬ 
dronizadas sao praticamente de mesma magni¬ 
tude). O fato de que uma variavel dependente 
tem um peso negativo e um positivo indica que 
as diferengas de grupos sao explicadas pelas 
diferengas entre as variaveis dependentes. 

Outra forma de olhar para os relaciona- 
mentos entre variaveis dependentes e CL dis- 
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criminantes e verificar a matriz estrutura, que 
fornece os coeficientes de correlagao canoni- 
cos da CL. Esses valores sao comparaveis as 
cargas dos fatores (veja o Capftulo 15) e in¬ 
dicam a natureza das CLs. Bargman (1970) 
argumenta que algumas variaveis dependentes 
apresentam altas correlates canonicas da CL 
enquanto outras tem valores baixos, as que 
tem valores altos contribuem mais para a se- 
paracao do grupo. Desse modo, elas represen- 
tam a contribuigao relativa de cada variavel 
dependente para a separacao do grupo (veja 
Bray e Maxwell, 1985, p. 42-45). Novamen- 
te, estamos interessados somente na primeira 
CL (porque a segunda nao foi significativa) e, 
olhando para a matriz de estrutura, podemos 
concluir que o numero de comportamentos 
foi levemente mais importante em diferenciar 
os tres grupos (porque 0,711 e maior do que 
0,576). Contudo, o numero de pensamentos e 
ainda muito importante porque o valor da cor- 
relagao e bastante alto. Como ocorreu com as 
ponderacdes padronizadas, o fato que uma va¬ 
riavel dependente tem uma correlagao positiva 
e a outra tem uma negativa indica que a sepa- 
racao do grupo e determinada pela diferenga 
entre as variaveis dependentes. 

A proxima parte da safda (Saida 14.11 do 
SPSS) informa os coeficientes da fungao dis- 
criminante canonica, que sao versoes nao-pa- 
dronizadas dos coeficientes padronizados des- 
critos acima. Desse modo, esses sao os valores 
de b na equagao (14.4) e voce ira notar que 
eles correspondem aos valores nos autoveto- 
res derivados na Segao 14.3.4.1 e utilizados na 
equagao (14.5). Esses valores nao sao tao uteis 
quanto a versao padronizada, mas mostram de 
onde surgiu a versao padronizada. A proxima 
tabela fornece as centroides para cada grupo. 
As centroides sao simplesmente a media dos 
escores da CL para cada grupo. Devemos 
olhar o sinal da centroide (positivo ou nega- 
tivo), e desses dados e possfvel ver que a CL 
1 discrimina o grupo TC (BT) dos outros dois 
(notavelmente o grupo TCC (CBT) porque 
as diferengas entre centroides sao as maiores 
para esses grupos). A segunda CL (que nao foi 
significativa) parece discriminar o grupo ST 


Saida 14.11 do SPSS 

Canonical Discriminant Function Coefficients 
(Coeficientes da fungao discriminante canonical 



Function (Fungao) 


1 

2 

Number of obsession-related 
behaviours (Numero de com- 

0.603 

0.425 

portamentos obsessivos) 
Number of obsession-related 

-0.335 

0.339 

thoughts (Numero de pensa¬ 
mentos obsessivos) 

(Constant) (Constante) 

2.139 

-6.857 


Functions at Group Centroids (Fungoes 
nas Centroides dos Grupos) 


Group (Fungao) 

Function (Fungao) 

1 

2 

CBT(TCC) 

BT (TC) 

No Treatment Control (Contro- 
le - Sem Tratamento) 

0.601 

-0.726 

0.125 

-0.229 

-0.128 

0.357 


Fungoes discriminante canonica nao-padronizadas avalia- 
das na media dos grupos 


(NT) dos dois grupos-experimentais (mas nao 
significativamente). O relacionamento entre 
as CLs e os grupos fica mais bem ressaltado 
utilizando um diagrama de grupos combinados 
(solicitado pela utilizagao da caixa de dialogo 
como a da Figura 14.7). Esse grafico apresenta 
os escores das CLs para cada pessoa, agrupa- 
dos de acordo com a condigao experimental a 
qual a pessoa pertence. Alem disso, as centroi¬ 
des dos grupos sao ressaltadas como o escore 
medio da CL para cada grupo. 

A Figura 14.9 mostra esse diagrama para 
os dados do TOC, e fica claro a partir da posi- 
gao das centroides (os grandes cfrculos rotula- 
dos com as iniciais do grupo) que a CL 1 dis¬ 
crimina o grupo TC do grupo TCC (olhe para 
a distancia horizontal entre essas centroides). 
A segunda CL nao diferencia qualquer grupo: 
ja sabfamos disso porque ela foi nao-significa- 
tiva, mas o diagrama mostra que as distancias 
verticais entre as centroides dos grupos sao 
pequenas, indicando que nao existe separagao 
entre grupos para essa CL. 
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Fungoes discriminantes canonicas 


Grupo 

© Centroides dos Grupos 
□ Sem Tratamento 
A TC 
X TCC 

- 3 - 2-10123 

Fungao 1 

Figura 14.9 Diagrama combinado dos grupos. 
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V. 


• A Analise da Fungao Discriminante (AFD) pode ser utilizada apos a MANOVA 
para ver como as variaveis dependentes discriminam os grupos. 

• A AFD identifies CLs (combinagoes das variaveis dependentes); para descobrir 
quantas CLs sao significativas, olhe para as tabelas Lambda de Wilks', se o valor 
Sig. e menor do que 0,05, a CL discrimina significativamente os dois grupos. 

• Uma vez que as CLs significativas tenham sido identificadas, utilize a tabela 
Coeficientes padronizados da fungao discriminante candnica (Standardized 
Canonical Discriminant Function Coefficientes) para descobrir como as va¬ 
riaveis dependentes contribuem para as CLs. Escores altos indicam que uma 
variavel dependente e importante para a CL e variaveis com coeficientes posi- 
tivos ou negativos estao contribuindo para a CL de forma oposta. 

• Finalmente, para descobrir que grupos sao discriminados pela CL, olhe para 
a tabela Fungdes nas Centroides dos Grupos (Functions at Group Centroids): 
para uma dada CL, grupos com valores de sinais opostos estao sendo discri¬ 
minados por essa CL. 


14.9 ALGUMAS CONSIDERAQOES 
FINAIS © 

14.9.1 A interpretacao final © 

Ate agora, colhemos muitas informagoes 
sobre os nossos dados, mas como podemos 


juntar todas para poder responder nossa ques- 
tao de pesquisa: a terapia pode melhorar o 
TOC, e se sim qual delas e a melhor? A MA¬ 
NOVA, nos informa que a terapia pode ter 
um efeito significativo nos sintomas do TOC 
(Transtorno Obsessivo-Compulsivo), mas as 
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ANOVAs univariadas nao-significativas suge- 
riram que essa melhoria nao e simplesmente 
em termos de pensamentos ou comportamen- 
tos. A analise discriminante sugere que a se- 
paragao dos grupos pode ser melhor explica- 
da em termos de uma dimensao subjacente. 
Nesse contexto, a dimensao e provavelmente 
o proprio TCC (o qual podemos presumir ser 
constitufdo tanto de pensamentos quanto de 
comportamentos). Assim, a terapia nao neces- 
sariamente muda comportamentos ou pensa¬ 
mentos per se, mas ela influencia a dimensao 
subjacente do TOC. Assim, a resposta para 
a primeira questao parece ser: sim, a terapia 
pode influencia o TOC, mas a natureza dessa 
influencia nao esta clara. 

A proxima questao e mais complexa: qual 
terapia e a melhor? A Figura 14.10 mostra os 
graficos dos relacionamentos entre as varia- 
veis dependentes e as medias dos grupos dos 
dados originais. O graftco das medias mostra 
que, para agoes, a TC (Terapia Comportamen- 
tal) reduz o numero de comportamentos ob- 
sessivos, enquanto a TCC (Terapia Cognitivo 
Comportamental) e ST (Sem Tratamento), 
nao. Para pensamentos, a TCC reduz o nu¬ 
mero de pensamentos obsessivos, enquanto a 
TC e ST, nao (confira o padrao das barras). 
Olhando agora para o relacionamento entre 
pensamentos e agoes no grupo de TC, existe 
relacionamento positivo quase linear entre 
pensamentos e agoes, assim, quanto mais pen¬ 
samentos obsessivos a pessoa apresenta, mais 
comportamentos obsessivos ela tera. No grupo 
TCC nao existe relacionamento (pensamentos 
e agoes variam de forma totalmente indepen- 
dente). No grupo dos sem tratamento (ST), 
existe um relacionamento negativo (e inciden- 
talmente nao-significativo) entre pensamentos 
e agdes. Descobrimos, da analise discriminan¬ 
te, que os comportamentos sao mais impor- 
tantes em termos do TOC (como um constru- 
to) que pensamentos (sabemos disso a partir 
das correlacdes da CL canonica). Entretanto, 
a terapia comportamental parece ser a melhor 
porque ela se direciona a comportamentos em 
vez de pensamentos (comparada a TCC ela e 
preferfvel - a despeito da distancia entre as 


centroides dos grupos na Figura 14.9). Con- 
tudo, a significance da funcao discriminante 
nao necessariamente nos diz que o grupo TC 
foi significativamente menor que o grupo ST 
(assim, fazer terapia nao e necessariamente 
melhor do que nao fazer terapia). Resumindo, 
a TC tem a maior influencia no TOC como um 
construto, em virtude da importancia relativa 
dos comportamentos nesse construto compa- 
rado a cognigao. 

14.9.2 ANOVA univariada ou Analise 
discriminante? (D 

Esse exemplo deve ter tornado claro que a 
ANOVA univariada e a analise discriminante 
sao formas de responder diferentes questoes 
que surgem de uma MANOVA significativa. 
Se a ANOVA univariada for escolhida, as cor- 
regoes de Bonferroni devem ser aplicadas no 
nfvel de aceitacao ou significance. Voce deve 
executar as duas analises para ter uma visao 
ampla do que esta acontecendo com os dados. 
A vantagem da analise discriminante e que ela 
lhe informa algo sobre as dimensdes subja- 
centes dentro dos dados (o que e especialmen- 
te util se voce tiver utilizado varias medidas 
dependentes numa tentativa de capturar algurn 
construtor social ou psicologico). Mesmo que 
a ANOVA univariada seja significativa, a ana¬ 
lise discriminante fornece algum conhecimen- 
to adicional dos dados e deve ser utilizada. 
Espero que este capftulo o tenha convencido 
dessa recomendagao! 

14.10 0 QUE DESCOBRIMOS SOBRE 
ESTATISTICA? @ 

Neste capftulo, discutimos obsessiva- 
mente sobre a MANOVA e a analise da fun- 
gao discriminante, e descobrimos, para nosso 
horror, que o Roy tem uma raiz grande. Des¬ 
cobrimos que para situagoes em que varias 
safdas foram medidas em grupos diferentes, 
a tecnica da ANOVA pode ser estendida e e 
denominada MANOVA (Analise de Varian- 
cia Multivariada). Utilizamos essa tecnica 
em vez de executar varias ANOVAs porque 
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Figura 14.10 Graficos mostrando (a) os relacionamentos e (b) as medias entre as variaveis de- 
pendentes em cada grupo da terapia. 
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assim mantemos controle sobre a taxa de erro 
do Tipo I e podemos incorporar o relaciona- 
mento entre variaveis de safda na analise. A 
MANOVA funciona de forma muito pare- 
cida a ANOVA, mas com matrizes em vez 
de numeros. Apresentamos um exemplo de 
MANOVA no SPSS e descobrimos que, para 
tornar a vida ainda mais complicada do que 
ja e, obtemos nao uma, mas quatro estatfs- 
ticas relacionadas ao mesmo efeito! Dessas, 
tentei convence-los de que o trago de Pillai 
e a opgao mais segura. Finalmente, analisa- 
mos duas opgoes para dar prosseguimento a 
MANOVA: executar varias ANOVAs ou uma 
analise da fungao discriminante. Dessas, a 
analise da fungao discriminante e a que nos 
fornece mais informagao, mas pode ser diff- 
cil de interpretar. 

14.11 TERMOS-CHAVE QUE 
DESCOBRIMOS 

• Testes de esfericidade de Bartlett 

• Teste de Box 

• Analise discriminante 

• Escores discriminantes 

• SSCP do eiTO (E) 

• HE 1 

• Homogeneidade da matriz de covariancias 

• Trago de Hotelling-Lawley (T 2 ) 

• SSCP das Hipoteses (H) 

• Matriz Identidade 

• Matriz 

• Multivariada 

• Analise Multivariada da Variancia (ou 
MANOVA) 

• Normalidade multivariada 

• Trago de Pillai-Bartlett (V) 

• Maior raiz de Roy 

• Matriz quadrada 

• Matrizes da soma dos quadrados e dos 
produtos cruzados (SSCP) 

• SSCP total (T) 

• Univariada 

• Matriz de variancias-covariancias 

• Lambda de Wilks 


14.12 TAREFAS DO ALEX ESPERTO 



Tarefa 1: Um psicologo clfni- 
co notou que varios de seus 
pacientes manfacos psicoticos 
personificavam galinhas em 
publico. Ele quis saber se esse 
comportamento poderia ser utilizado 
para diagnosticar esse transtorno e entao 
decidiu comparar seus pacientes com 
uma amostra de pessoas normais. Ele ob- 
servou 10 de seus pacientes durante um 
dia normal. Ele tambem precisou obser- 
var as 10 pessoas mais normais que con- 
seguisse achar: naturalmente, ele esco- 
lheu observar professores da Universidade 
de Sussex. Ele mensurou todos os parti- 
cipantes utilizando duas variaveis depen- 
dentes: a primeira foi o numero de perso- 
nificagbes que eles fizeram nas ruas de 
Brighton durante um dia e a segunda ava- 
liou o quanto foi bom o desempenho 
(medido numa escala ate 10 por um cria- 
dor de galinhas experiente). Os dados es- 
tao no arquivo chiken.sav; utilize a MA¬ 
NOVA e a AD (Analise discriminante) a 
fim de verificar se essas variaveis podem 
ser utilizadas para distinguir pacientes 
manfacos psicoticos daqueles que nao 
tern o transtorno. 

Tarefa 2: Estava interessado em saber se 
o conhecimento dos diferentes aspectos 
da psicologia melhorava ao longo do cur- 
so. Peguei uma amostra de alunos do pri- 
meiro, segundo e terceiro ano e apliquei 
a eles cinco testes (numa escala ate 15) 
envolvendo diferentes aspectos da psico¬ 
logia: Exper (psicologia experimental, 
como psicologia cognitiva e neuropsi- 
cologia); Stats (Estatistica); Social (psi¬ 
cologia social); Develop (Psicologia do 
desenvolvimento); Person (personalida- 
de). Sua tarefa e: (1) executar uma analise 
geral apropriada para determinar se existe 
uma diferenga global entre os grupos ao 
longo dessas cinco medidas; ( 2 ) verifi¬ 
car os valores das diferengas dos grupos 
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nas sardas e interpretar os resultados de 
acordo; (3) selecionar contrastes para tes- 
tar a hipotese de que o segundo e o ter- 
ceiro ano terao resultados melhores, em 
todas as escalas, do que o primeiro ano; 

(4) selecionar testes que comparem todos 
os grupos entre si - compare brevemente 
esses resultados com os dos contrastes; e 

(5) executar uma analise separada na qual 
voce testa se a combinagao das medidas 
pode discriminar os grupos com sucesso 
(comente brevemente essa analise). In- 
clua somente aquelas escalas que revela- 
ram diferencas entres os grupos para os 


contrastes. Como esses resultados pode- 
rao ajuda-lo a explicar os achados da sua 
analise inicial? Os dados estao no arquivo 

psychology.sav. @ 

14.13 LEITURAS COMPLEMENTARES 

BRAY, J. H„ MAXWELL, S. E. Multivariate 
analysis of variance. Sage university paper 
series on quantitative applications in the social 
sciences. Newbury Park (CA): Sage. 1985, p. 
07-54. Essa monografia sobre a MANOVA 
e soberba; nada ha de melhor que eu possa 
recomendar. 



15 

ANALISE DE FATORES 
EXPLORATORIA 


15.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 

Nas ciencias sociais, geralmente tenta- 

mos medir coisas que nao podem ser medidas 
diretamente (as chamadas varidveis latentes 
ou construtos). Por exemplo, estudantes de 
administrate) (ou mesmo psicologos) podem 
estar interessados em medir a exaustao (bur¬ 

nout), que e quando alguem que tern trabalha- 
do muito num projeto (um livro, por exemplo) 
msmasrm 

se encontra destituido de motivagao e inspira- 

cao e quer bater com a cabega varias vezes no 
computador. Voce nao pode medir a exaustao 
diretamente: ela tern muitas facetas. Entretan- 
to, pode medir varios aspectos da exaustao: a 
motivagao, o nivel de estresse, se a pessoa tern 
alguma ideia nova e assim por diante. Feito 

isso, seria util saber se essas medidas real- 
mente refletem uma unica variavel. Colocando 
de outra forma, essas diferentes variaveis sao 

manifestagSes de uma mesma variavel basica? 
Este capitulo ira apresentar a andlise de fato¬ 
res (e a andlise de componentes principals), 
uma tecnica para identificar grupos ou agru- 
pamentos de variaveis. Essa tecnica tem tres 
usos principais: (1) entender a estrutura de um 
conjunto de variaveis (por exemplo, pioneiros 


da inteligencia como Spearman e Thurstone 
utilizaram a analise de fatores para tentar en¬ 
tender a estrutura da variavel latente “inteli¬ 
gencia”); (2) construir um questionario para 
medir uma variavel subjacente (por exemplo, 
voce pode fazer um questionario para medir a 
exaustao); e (3) reduzir um conjunto de dados 
a um tamanho rnais manejavel enquanto se 
retem o maximo da informagao original pos- 
sfvel (por exemplo, vimos no Capitulo 5 que a 
multicolinearidade pode ser um problema na 
regressao multipla e a analise de fatores pode 
ser utilizada para resolver esse problema com- 
binando variaveis colineares). Ao longo deste 
capitulo, iremos descobrir o que sao fatores, 
como os encontramos e o que eles nos infor¬ 
mant (se informant algo) sobre o relaciona- 
mento entre as variaveis que medimos. 

15.2 FATORES© 

Se medirmos diversas 
variaveis, ou fizermos varias 
perguntas para alguem sobre 
eles mesmos, a correlagao en¬ 
tre cada par de variaveis (ou 
perguntas) pode ser organi- 
zada em uma matriz-R. Uma 
matriz-R e uma matriz de cor- 
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redoes: uma tabela de coeficientes de corre¬ 
lates entre variaveis (vimos versoes menores 
dessa matriz no Capftulo 4).©s elementos dia¬ 
gonals de uma matriz-R sao iguais a 1, porque 
cada variavel ira se correlacionar perfeitamente 
com ela mesm H Msglei 1 i o i m .1 

nal sao os coeficientes de correlacao entre os 

pares de variaveis ou questoes. 1 A existencia 

de varios coeficientes de correlacao altos entre 
subconjuntos de variaveis sugere que essas va¬ 
riaveis podem estar medindo aspectos de uma 
mesma dimensao subjacente. Essas dimensoes 

subjacentes sao conhecidas como fatores (ou 
variaveis latentes). Pela reducao de um conjun- 
to de dados a partir de um grupo de variaveis 
inter-relacionadas em um conjunto menor, a 
analise de fatores obtem a parcimonia expli- 
cando a quantidade maxima da variancia co¬ 
mum em uma matriz de correlacao utilizando 
um numero menor de conceitos explanatorios. 

Existem inumeros exemplos do uso da 
analise de fatores nas ciencias sociais. Os te- 
oricos da personalidade em psicologia usam a 
analise de fatores para medir tracos de perso¬ 
nalidade. A maioria dos leitores esta familia- 
rizada com a extroversao-introversao e tracos 
neuroticos medidos por Eysenck (1953). Mui- 
tos outros questionarios sobre a personalidade 
estao baseados na analise de fatores (notada- 
mente, Cattell’s, 1966a, questionario de 16 fa- 


1 Essa matriz e chamada de matriz-R, ou R, porque ela 
contem coeficientes de correlacao e o r geralmente re- 
presenta o coeficiente de correlacao de Pearson (veja o 
Capftulo 4) - o r se torna maiusculo quando representa 
uma matriz. 


tores de personalidade), e esses levantamentos 
sao frequentemente usados para propositos de 
recrutamento em industrias e ate em alguns 
grupos religiosos. Entretanto, embora a analise 
de fatores seja mais conhecida por ser adotada 
por psicologos, seu uso, de maneira alguma, 
esta restrito a mensuracao de dimensoes da 
personalidade. Economistas, por exemplo, po¬ 
dem usar a analise de fatores para verificar se a 
produtividade, lucro e forga de trabalho podem 
ser reduzidos a uma dimensao subjacente do 
crescimento da companhia, e Jeremy Miles me 
contou que um bioqmmico usou a analise de 
fatores para analisar amostras de urina! 

Vamos colocar algumas dessas ideias em 
pratica imaginando que queremos medir os 
diferentes aspectos que tornam uma pessoa 
popular. Podemos aplicar varias medidas que 
acreditamos explorar diferentes aspectos da 
popularidade. Assim, podemos medir as habi- 
lidades sociais de uma pessoa (Social Skills ), 
seu egofsmo (Selfish), quao interessante os 
outras a acham (Interest), a proporcao de tem¬ 
po que gastam falando sobre a outra pessoa 
durante uma conversa (Talk 7), a proporcao 
de tempo que gastam falando delas mesmas 
(Talk 2) e sua propensao para mentir a outras 
pessoas (the Liar Scale). Podemos calcular os 
coeficientes de correlacao para cada par de 
variaveis e criar uma matriz-R. A Tabela 15.1 
mostra essa matriz. Todos os coeficientes de 
correlacao significativos estao em negrito. 
Esta claro que existem dois conjuntos de va¬ 
riaveis interrelacionadas. Portanto, essas va¬ 
riaveis podem estar medindo algumas dimen- 


Tabela 15.1 Uma matriz-R 



Conversa 1 
(Talk 1) 

Habilidades 
Sociais 
(Social Skills ) 

Interessante Conversa 2 
(Interest) (Talk 2) 

Egoista 

(Selfish) 

Mentiroso 

(Liar) 

Conversa 1 [Talk 1) 

1,000 






Habilidades Sociais 
(Social Skills) 

0,772 

iSOtHJ— 

1,000 

) 




Interesse (Interest) 

N14546 

0,879 

1,000 




Conversa 2 (Talk 2) 

0,074 

-0,120 

0,054 


SOT § 


Egoista ( Selfish ) 

-0,131 

0,031 

-0,101 

0,441 

1,000 


Mentiroso (Liar) 

0,068 

0,012 

0,110 

0,361 

0,277 

1,000 
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soes comuns subjacentes. A quantidade de 
tempo que alguem fala de outra pessoa duran¬ 
te uma conversa parece se correlacionar com o 
nfvel de habilidade social e quao interessante 
os outros acham aquela pessoa. Habilidades 
sociais tambem se correlacionam com quao 
interessante os outros acham aquela pessoa. 
Esses relacionamentos indicam que quanto 
melhores suas habilidades sociais, mais inte¬ 
ressante e tagarela e provavel que voce seja. 
Entretanto, existe um segundo conjunto de 
variaveis. A quantidade que as pessoas falam 
delas mesmas numa conversa se correlaciona 
com o quao egoista elas sao e o quanto elas 
mentem. Ser egoista tambem se correlaciona 
com o grau que uma pessoa conta mentiras. 
Resumindo, e mais provavel que pessoas ego- 
fstas mintam e falem sobre elas mesmas. 

Na analise de fatores, nos esforgamos para 
reduzir a matriz-R a sua dimensao subjacente 
olhando para as variaveis que parecem se aglo- 
merar de maneira significativa. Essa redugao 
de dados e alcangada olhando as variaveis que 
se correlacionam altamente com um grupo de 
outras variaveis, mas que nao se correlacionam 
com as variaveis fora daquele grupo. Nesse 


exemplo, parece haver dois aglomerados que se 
encaixam nessa ideia. O primeiro fator parece 
se relational - com a sociabilidade em geral, en- 
quanto o segundo fator parece se relacionar com 
a maneira que a pessoa trata os outros social- 
mente (podemos chama-lo de Consideracao). 
Portanto, podemos assumir que a popularidade 
depende nao somente da sua sociabilidade, mas 
tambem de se voce e autentico com os outros. 

15.2.1 Representagao grafica dos 
fatores © 

Fatores (nao confundir com variaveis in- 
dependentes da ANOVA fatorial) sao entidades 
estatisticas que podem ser visualizadas como 
eixos de um sistema de coordenadas onde as 
variaveis podem ser representadas. De forma 
simples, essa afirmagao significa que se voce 
imaginar que os fatores sejam os eixos de um 
sistema de coordenadas, e possfvel represen- 
tar as variaveis ao longo desses eixos. As co¬ 
ordenadas das variaveis ao longo de cada eixo 
representam a forga do relacionamento entre 
a variavel e cada fator. A Figura 15.1 mostra 
o grafico para os dados de popularidade (nos 



Figura 15.1 Exemplo de um diagrama de fatores. 
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quais existem somente dois fatores). Note que 
para ambos os fatores o eixo vai de — 1 a 1, que 
sao os limites maximos dos coeficientes de cor- 
relacao. Os circulos representam as tres varia- 
veis que se correlacionam altamente com o fa- 
tor 1 (sociabilidade: eixo horizontal), mas tern 
uma baixa correlacao com o fator 2 (conside- 
racao com os outros: eixo vertical). Contraria- 
mente, os triangulos representam variaveis que 
se correlacionam altamente com consideracao 
para com os outros, mas tern uma baixa corre- 
lacao com sociabilidade. Desse grafico, pode- 
mos afirmar que o egolsmo, a quantidade que a 
pessoa fala dela mesma, e a propensao a menti- 
ra contribuem para o fator de consideracao para 
com os outros. Contrariamente, o quanto uma 
pessoa tem interesse por outras, quao interes- 
sante ela e e o seu grau de sociabilidade con- 
tribui para o segundo fator, sociabilidade. Esse 
diagrama, portanto, apoia a estrutura que esta- 
va aparente na matriz-R. E claro, se um terceiro 
fator existisse dentre esses dados, ele poderia 
ser representado por um terceiro eixo (crian- 
do um grafico em 3-D). Tambem, se existirem 
mais do que tres fatores em cada conjunto de 
dados, eles nao podem ser representados por 
um desenho bidimensional. 

Se cada eixo do grafico representa um fa¬ 
tor, as variaveis que irao compor um fator po¬ 
dem ser traqadas de acordo com a extensao a 
qual elas se relacionam com esse fator. As co- 
ordenadas de uma variavel, portanto, represen- 
tam seu relacionamento com os fatores. Num 
mundo ideal, uma variavel deveria ter uma co- 
ordenada grande para um dos eixos e uma co- 
ordenada baixa para qualquer outro fator. Essa 
hipotese indicaria que essa variavel especlfica 
se relacionou somente com um fator. Variaveis 
que tem grandes coordenadas no mesmo eixo 
supostamente medem diferentes aspectos de 
uma dimensao comum snbiacente. fflMb oO ilffll 
nada de uma variavel ao longo de um eixo de 
classificagao e conhecida como cargo do fator. 

correlacao de Paerson entre o fator e a varia- 

vel (veja o Quadro 15.1). Do que ja sabemos 
sobre a interpretacao do coeficiente de corre- 


se elevarmos ao quadrado a carga do fator, ob- 
teremos uma rnedida da importancia s de uma 
variavel particular para um determinado fator. 



15.2.2 Representagao matematica dos 
fatores (D 

Os eixos tra§ados na Fi- 
gura 15.1 sao linhas retas e, 
assirn, podem ser descritas ma- 
tematicamente por uma equa- 
cao de uma linha reta. Portan¬ 
to, fatores tambem podem ser descritos em 
termos dessa equacao. Temos usado a equa^ao 
de uma linha reta inumeras vezes ao longo 
deste texto e, assim, voce deve conhece-la 
bem. A Equacao (15.1) nos lembra da equacao 
que descreve um modelo linear, e isso pode ser 
aplicado ao cenario da descricao de um fator. 
Voce ira notar que nao existe intercepto na 
equacao: o motivo e que as linhas se intercep- 
tam no zero (portanto, o intercepto e, tambem, 
zero). Os bs na equacao representam as cargas 
dos fatores: 


Y t — b 1 X t + b 2 X 2 + ... + b n X ll + s { 

Fator; = bj Variavelj + Z? 2 Variavel 2 

+ ... + b n Variavel„ + s t (15.1) 

No nosso exemplo de popularidade, en- 
contramos dois fatores subjacentes: sociabi¬ 
lidade e consideracao. Podemos, portanto, 
construir uma equacao que descreva cada fa¬ 
tor em termos das variaveis que foram medi- 
das. A equacao e mostrada em (15.2): 

'1§E/ A 

Sociabilidade; = i,Conversal; + b 2 IIabilidades 
§ociais; -jl^Wteresse; 
iiaBO btiMrsii, - lagap siMma, 

Consideracao, = b , Con versa I, -|- £> 2 Habilidades 
Sociais; + £> 3 Interesse, 

+ £> 4 Conversa2; 

+ /7 5 Egoismo, 

+ i> 6 MentirosO; + e ; (15.2) 

Primeiro, note que as equacoes sao iden- 
ticas na forma: ambas incluem todas as varia- 
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veis que medimos. Entretanto, os valores de 

b nas duas equagoes serao diferentes (depen- 
dendo da importancia relativa de cada variavel 
para um fator particular). Na verdade, pode- 
mos substituir cada valor de b com a coorde- 
nada daquela variavel no grafico da Figura 
15.1 (isto e, substitua os valores de b pelas 
cargas dos fatores). As equacoes resultantes 
sao mostradas em (15.3): 

Y i = b { X t + b 2 X 2 + ... + b n X n + e,- 
Sociabilidade, = 0,87 Conversa 1,- 

+ 0,96 Habilidades Sociais, 

+ 0,92 Interesse, 

+ 0,00 Conversa2, 

— 0,10 Egoismo, 

+ 0,09 Mentiroso, + e,- 
Consideragao, = 0,01 Conversa I, 

+ 0,03 Habilidades Sociais ; 

+ 0,04 Interesse,- 
+ 0,82 Conversa2, 

+ 0,75 Egoismo, 

+ 0,70 Mentiroso, + (15.3) 

Note que, para o fator sociabilidade, os 
valores de b sao altos para Conversa 1, Habili¬ 
dades Sociais e Interesse. Para as variaveis res- 
tantes (Conversa 2, Egoismo e Mentiroso) os 
valores de b sao baixos (proximo a zero). Isso 
nos diz que tres das variaveis sao muito impor- 
tantes para aquele fator (aquelas com valores 
altos de b) e que as outras tres nao sao muito 
importantes (aquelas com valores de b baixos). 
Vimos que isso e verdadeiro pela maneira com 


que as tres variaveis estavam altamente aglo- 
meradas no grafico do fator. O que temos que 
levar em conta aqui e que o grafico do fator e 
essas equates representam o mesmo: as car- 
gas dos fatores no grafico sao simplesmente os 
valores de b nessas equacoes (veja o Quadro 
15.1). Para o segundo fator, desconsiderando 
os demais, o padrao oposto pode ser visto, 
isto e, Conversa 2, Egoismo e Mentiroso tem 
valores altos de b, enquanto as tres variaveis 
restantes tem valores de b proximos a zero. 
Num mundo ideal, variaveis teriam valores de 
b bem altos para um fator e valores de b bem 
baixos para os demais fatores. 

Essas cargas dos fatores podem ser colo- 
cadas numa matriz na qual as colunas repre¬ 
sentam os fatores e as linhas representam as 
cargas de cada variavel em relagao a cada fa¬ 
tor. Para os dados de popularidade, essa matriz 
teria duas colunas (uma para cada fator) e seis 
linhas (uma para cada variavel). Essa matriz, 
normalmente representada por A, pode ser 
vista abaixo. Para entender o que a matriz sig- 
nifica, tente relacionar os elementos da mesma 
com as cargas vistas na equagao (15.3). Por 
exemplo, a linha de cima representa a primei- 
ra variavel, Conversa 1, que tem uma carga de 
0,87 para o primeiro fator (Sociabilidade) e 
uma carga de 0,01 para o segundo fator (Con- 
sideragao). Essa matriz e chamada de matriz 
dos fatores ou matriz dos componentes (se 

estiver fazendo analise de componentes prin¬ 
cipals)^ 

diferentes formas dessa matriz. 


Quadro 15.1 


Qual e a diferenca entre uma matriz padrao e uma matriz estruturada? © 

Fui bastante vago na discussao sobre a carga dos fatores. Algumas vezes, afirmei que essas 
cargas podem ser pensadas como a correlagao entre a variavel e um dado fator e, em outras 
ocasioes, descrevi essas cargas em termos de coeficientes da regressao (b). Deveria ser obvio a 
partir do que descobrimos nos Capitulos 4 e 5 que os coeficientes de correlagao e de regressao 
sao duas coisas bem diferentes, assim, do que, de fato, estou falando? Eu nao deveria a essa 
altura saber o que essas cargas dos fatores sao? 

(Continua) 


















558 Andy Field 


Quadro 15.1 ( Continuagao) 


Bern, tanto o coeficiente de correlagao quanto o de regressao representam o relacionamento 
entre uma variavel e o modelo linear num sentido amplo, assim, a mensagem principal aqui e 
que as cargas dos fatores nos informam o quanto uma variavel contribui para formar urn fator. Se 
entender isso, voce nao tera problemas. 

Entretanto, a carga de um fator numa determinada analise pode ser tanto um coeficiente de 
correlagao quanto um de regressao. Apos algumas segoes iremos descobrir que a interpretagao da 
analise de fatores melhora muito com uma tecnica chamada de rotagao. Sem entrar em detalhes, 

togonal e usada, qualquer fator subjacente e assumido como independentes e a carga do fator e a 
correlagao entre o fator e a variavel, mas e, tambem, o coeficiente de regressao. Colocando de outra 
maneira, os valores dos coeficientes de correlagao sao os mesmos que os valores dos coeficientes 
de regressao. Entretanto, existem situagoes em que os fatores subjacentes sao supostamente rela- 
cionados ou correlacionados entre si. Nessas situagoes, a rotagao obliqua e usada e as correlagoes 
resultantes entre variaveis e fatores irao diferir dos correspondentes coeficientes regressao. Nesse 
caso, existem, de fato, dois conjuntos diferentes de cargas de fatores: os coeficientes de correlagao 
entre cada variavel e o fator (que estao na matriz de estrutura dos fatores) e os coeficientes de re¬ 
gressao para cada variavel em cada fator (que estao na matriz padrao dos fatores ). Esses coeficien¬ 
tes podem ter interpretagoes bem diferentes (veja Graham, Guthrie e Thompson, 2003). 


f 0,87 

0,01' 

0,96 

-0,03 

0,92 

0,04 

0,00 

0,82 

-0.10 

0,75 

l 0,09 

0,70, 


A hipotese principal da analise de fatores 
e que esses fatores algebricos representam di- 
mensdes reais, cuja natureza deve ser buscada 
inspecionando as variaveis que apresentam as 
maiores cargas no mesmo fator. Assim, psi- 
cologos acreditam que fatores representam 
dimensoes da psique, pesquisadores da edu- 
cagao acreditam que elas representam habili- 
dades e sociologos podem achar que elas re¬ 
presentam rag as ou classes sociais. Entretanto, 
essa hipotese e controversa e alguns acreditam 
que as dimensoes derivadas da analise de fato¬ 
res sao reais somente no sentido estatfstico - e 
uma ficgao no mundo real. 

15.2.3 Escores dos fatores © 

Um fator pode ser descrito em termos das 
variaveis mensuradas e da importancia relati- 
va delas para aquele fator (representado pelo 


valor de b). Portanto, tendo descoberto quais 
fatores existem e estimado a equagao que os 
descreve, deveria ser possfvel tambem estimar 
o escore de uma pessoa num fator baseado nos 
seus escores para as variaveis constituintes. 
Assim, se queremos derivar um escore de so- 
ciabilidade para uma determinada pessoa, po- 
demos colocar seus escores nas varias medidas 
na equagao (15.3). Esse metodo e conhecido 
como media ponderada. Na verdade, esse me¬ 
todo e muito simplista e raramente usado, mas 
e provavelmente a maneira mais facil de ex- 
plicar o princfpio. Por exemplo, imagine que 
temos seis escalas variando de 1 a 10 e que 
alguem obteve os seguintes valores: Conversa 
1 (4), Habilidades Sociais (9), Interesse (8), 
Conversa 2 (6), Egofsmo (8), e Mentiroso (6). 
Podemos entrar com esses valores na equagao 
(15.3) para obter um escore da sociabilidade 
da pessoa e sua consideragao pelos outros 
(veja a Equagao (15.4)). Os valores resultantes 
de 19,22 e 15,21 refletem o grau de sociabili¬ 
dade da pessoa e sua consideragao para com 
os outros, respectivamente. Essa pessoa obte¬ 
ve um escore maior em sociabilidade do que 
na consideragao pelos outros. Entretanto, as 
escalas de medidas utilizadas irao influenciar 
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os resultados obtidos e se diferentes variaveis 
foram medidas com escalas diferentes, os es- 
cores para diferentes fatores nao poderao ser 
comparados. Portanto, o metodo de calcular 
os escores dos fatores e pobre e metodos mais 
sofisticados sao normalmente utilizados. 

Sociabilidade = 0,87 Conversal + 0,96 
Habilidades Sociais 
+ 0,92 Interesse, 

+ 0,00 Conversa2 

— 0,10 Egoismo 
+ 0,09 Mentiroso, 

Sociabilidade = (0,87 x 4) + (0,96 x 9) 

+ (0,92 x 8) + (0,00 x 6) 

- (0,10 x 8)+ (0,09 x 6) 

= 19,22 

C'onsideracao = 0,01 Conversal 

+ 0,03 Habilidades Sociais 
+ 0,04 Interesse 
+ 0,82 Conversa2 
+ 0,75 Egoismo 
+ 0,70 Mentiroso, 

Consideragao = (0,01 x 4) — (0,03 x 9) 

+ (0,04 x 8) + (0,82 x 6) 

+ (0,75 x 8) + (0,70 x 6) 

= 15,21 (15.4) 

15.2.3.1 0 metodo da regressao © 

Existem varias tecnicas sofisticadas para 
calcular os escores dos fatores que utilizam os 
coeficientes dos fatores como pesos ou ponde- 
racoes na equaqao (15.1) em vez de utilizarem 
as cargas dos fatores. A forma da equ actio per- 
manece a mesma, mas os b& da equa§ao sao 
substituidos pelos coeficientes dos fatores. Os 
coeficientes dos fatores podem ser calculados 
de varias formas. A mais simples e o metodo 
da regressao. Nesse metodo, as cargas dos fa¬ 
tores sao ajustadas para levar em conta as cor- 
rclacoes iniciais entre as variaveis e, ao fazer 
isso, as diferencas nas unidades de medidas e 
as variancias das variaveis sao estabilizadas. 

Para obter a matriz dos coeficientes dos 
fatores ( B ), multiplicamos a matriz das car¬ 
gas dos fatores pela inversa (R _1 ) original das 
correlates ou matriz-R. No capitulo anterior, 


vimos que matrizes nao podem ser divididas 
(Seijao 14.3.4.1). Dessa forma, nao podemos 
dividir por uma matriz diretamente, precisa- 
mos multiplicar pela sua inversa. Portanto, ao 
multiplicarmos a matriz da carga dos fatores 
pela inversa da matriz das correlates, esta- 
mos dividindo as cargas dos fatores pelos co¬ 
eficientes de correlaqao. A matriz dos escores 
dos fatores resultante, dessa forma, representa 
o relacionamento entre cada variavel e cada 
fator levando em conta o relacionamento ori¬ 
ginal entre os pares de variaveis. Desse modo, 
essa matriz representa uma medida mais pura 
da re I actio unica entre variaveis e fatores. 

As matrizes para os dados da popularidade 
sao mostradas a seguir. A matriz dos coeficien¬ 
tes dos fatores, B , e fornecida pelo SPSS. As 
matrizes R 1 e A podem ser multiplicadas ma- 
nualmente para a obtencao da matriz B\ quern 
entende de algebra matricial (ou quern consul- 
tou Namboodiri, 1984, ou Stevens, 1992) po¬ 
dem verificar o resultado (os calculos estao no 
arquivo FactorScores.pdf disponrvel no site 
www.artmed.com.br). Para obter o mesmo re¬ 
sultado que o SPSS, sera necessario trabalhar 
com pelo menos cinco casas decimals. 

B = R l A 


4,76 

-7,46 

3,91 

-2,35 

2,42 

-0,49 

-7,46 

18,49 

-12,42 

5,45 

-5,54 

1,22 

3,91 

-12,42 

10,07 

-3,65 

3,79 

-0,96 

-2,35 

5,45 

-3,65 

2,97 

-2,16 

0,02 

2,42 

-5,54 

3,79 

-2,16 

2,98 

-0,56 

, -0,49 

1,22 

-0,96 

0,02 

-0,56 

1,27 


0,87 0,01 

0,96 -0,03 

0,92 0.04 

0,00 0.82 

-0,10 0,75 

, 0,09 0,70, 

' 0,343 0,006' 

0,376 -0,020 
0,362 0,020 

0,000 0,473 

-0,037 0,437 

0,039 0,405 

O padrao das cargas e o mesmo dos coe¬ 
ficientes dos fatores; isto e, as primeiras tres 
variaveis tem altas cargas no primeiro fator e 
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baixas cargas no segundo, enquanto o padrao 
e inverso para as tres ultimas variaveis. A di- 
ferenga esta somente nos valores das pondera- 
goes, que sao menores porque as correlagoes 
entre as variaveis estao, agora, sendo levadas 
em conta. Esses coeficientes dos fatores po- 
dem ser utilizados para substituir os valores b 
na equagao (15.4): 

Sociabilidade = 0,343 Conversal 

+ 0,376 Habilidades Sociais 
+ 0,362 Interesse 
+ 0,000 Conversa2 

— 0,037 Egofsmo 
+ 0,039 Mentiroso 

Sociabilidade = (0,343 x 4) + (0,376 x 9) 

+ (0,362 x 8) + (0,000 x 6) 

— (0,037 x 8) + (0,039 x 6) 

= 7,59 (15.5) 

Consideragao = 0,006 Conversal 

— 0,020 Habilidades Sociais 
+ 0,020 Interesse 

+ 0,473 Conversa2 
+ 0,437 Egofsmo 
+ 0,405 Mentiroso 

Consideragao = (0,006 x 4) — (0,020 x 9) 

+ (0,020 x 8) + (0,020 x 6) 

+ (0,473 x 6) + (0,437 x 8) 
+(0,405 x 6) 

= 8,768 

A equagao (15.5) mostra como esses es- 
cores dos coeficientes sao utilizados para 
produzir dois fatores para cada pessoa. Nesse 
caso, o participante apresenta os mesmos es- 
cores em cada variavel que foram utilizados 
na equagao (15.4). Os escores resultantes sao 
mais parecidos do que quando as cargas dos 
fatores foram utilizadas como ponderagoes 
porque as diferentes variancias entre as seis 
variaveis agora estao sendo controladas. O 
fato dos valores serem bem semelhantes refle- 
te que essa pessoa nao apenas apresenta um 
escore alto em relagao as variaveis represen- 
tando sociabilidade, mas ela apresenta tam- 
bem pouca consideragao para com os outros 
(isto e, ela apresenta altos escores igualmen- 


te nos dois fatores). Essa tecnica de produzir 
escores de fatores assegura que os resultados 
tenham uma media de 0 e uma variancia igual 
ao quadrado do coeficiente de correlagao mul- 
tipla entre os escores dos fatores estimados e 
os verdadeiros valores dos fatores. Contudo, o 
problema com o metodo de regressao e que os 
escores podem estar correlacionados nao ape¬ 
nas com outros fatores alern daquele em que 
eles foram baseados, mas tambem com outros 
escores de diferentes fatores ortogonais. 


15.2.3.2 Outros metodos 



Para superar os problemas 
associados a tecnica de regres¬ 
sao, dois ajustes foram propos- 
tos: o metodo Bartlett e o meto¬ 
do Anderson-Rubin. O SPSS 
pode produzir escores dos fatores baseados em 
qualquer um desses metodos. O metodo Bartlett 
produz escores imparciais e que se correlacio- 
nam apenas com seu proprio fator. A media e o 
desvio padrao dos escores sao os mesmos do 
metodo de regressao. Entretanto, os escores dos 
fatores podem, ainda, se correlacionar entre si. 
ipi metodo final e o de Anderson-Rubin, uma 
modificagao do de Bartlett que produz escores 
dos fatores padronizados e nao-correlacionados 
(eles apresentam uma media de 0 e um desvio 
padrao de 1). Tabachnick e Fidell (2001) con- 
cluem que o metodo de Anderson-Rubin e me- 
lhor quando escores nao-correlacionados sao 
requeridos, mas o metodo de regressao e prefe- 
rido em outras circunstancias simplesmente 
porque e o de mais facil compreensao. Embora 
nao seja crucial que voce entenda os calculos 
por tras dos metodos, e importante que voce 
saiba o que os escores dos fatores representam: 
a saber, um escore multiplo para cada indivfduo 
em um fator particular. 


15.2.3.3 Usos dos escores dos fatores © 

Existem varios usos para os escores dos 
fatores. Primeiro, se o proposito da analise de 
fatores e reduzir um grande conjunto de dados 
em um subconjunto menor de variaveis, os es¬ 
cores dos fatores nos darao um escore indivi- 
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dual nesse subconjunto de medidas. Portanto, 
qualquer analise adicional pode ser realizada 
nos escores dos fatores em vez de nos dados 
originals. Por exemplo, podemos conduzir um 
teste t para verificar se as mulheres sao signifi- 
cativamente mais sociaveis do que os homens 

usando o escore dos fatores para sociabilidade. 
Um segundo uso e superar problemas de co- 
linearidade na regressao. Se, examinando uma 
analise de regressao multipla, identificamos 
fontes de multicolinearidade, a interprctacao da 

Mi ialiM. | j* it 

Nessa situagao, podemos simplesmente condu¬ 
zir uma analise de fatores nas variaveis previso- 
ras para reduzi-las a um subconjunto de fatores 
nao-correlacionados. As variaveis que causam 
a multicolinearidade irao se agrupar forman- 
do um fator. Se executarmos novamente a re¬ 
gressao, mas utilizando os escores dos fatores 
como variaveis previsoras, o problema da mul¬ 
ticolinearidade devera desaparecer (porque as 
variaveis agora estao agrupadas em um unico 
fator). Existem meios nos quais podemos asse- 
gurar que os fatores nao estao correlacionados 
(uma maneira e usar o metodo Anderson-Rubin 
- veja acima). Usando fatores nao-correlacio- 
nados como previsores na regressao, podemos 
estar confiantes de que nao havera correlaijao 
entre os previsores e, consequentemente, tam- 
bem nao havera multicolinearidade. 

15.3 DESCOBRINDO FATORES © 

Voce j a aprendeu o que e um fator, como 
ele e representado grafica e algebricamente 
e como podemos calcular escores compostos 
representando um “desempenho” individual 
num unico fator. Restringi a discussao a um nf- 
vel conceitual sem investigar como realmente 
encontramos essas bestas miticas conhecidas 
como fatores. Esta secao ira apresentar como 
encontramos os fatores. Especificamente, exa- 
minaremos varios metodos, observaremos os 
calculos por tras de um metodo (componentes 
principals), investigaremos o criterio para de- 
terminar se os fatores sao importantes e des- 
cobrir como melhorar a interprctacao de uma 
dada solucao. 


15.3.1 Escolhendo um metodo © 

Ha varios metodos para extrair fatores 
dos seus dados. O metodo que voce ira esco- 
lher dependera do que voce espera fazer com a 
analise. Tinsley e Tinsley (1987) fornecem um 
excelente relato dos diferentes metodos dispo- 
nrveis. Existem duas coisas a serem conside- 
radas: se voce quer generalizar os resultados 
da sua amostra para a populacao e se esta ex- 
plorando seus dados ou testando uma hipotese 
especffica. Este capitulo descreve tecnicas para 
a exploracao de dados utilizando a analise de 
fatores. Testar hipoteses sobre as estruturas de 
variaveis latentes e seus relacionamentos e con- 
sideravelmente complexo e pode ser feito com 
programas de computador especificos, como o 
AMOS. Quern estiver interessado em tecnicas 
de testar hipoteses (conhecida como analise 
de fatores confirmatoria), consulte Pedhazur e 
Schmelkin (1991, Capitulo 23) para uma intro- 
ducao. Supondo que queremos explorar nossos 
dados, devemos considerar se queremos aplicar 
nossas descobertas a amostra coletada (metodo 
descritivo) ou generalizar os resultados para a 
populacao (metodo inferencial). A analise dos 
fatores foi originalmente desenvolvida para 
ser utilizada na exploracao dos dados gerando 
hipoteses futuras. Como tal, foi suposto que a 
tecnica seria aplicada para toda a populacao de 
interesse. Portanto, algumas tecnicas supoem 
que a amostra usada e a populacao e, assim, 
os dados nao podem ser extrapolados alem 
daquela amostra particular. A analise de com¬ 
ponentes principals e um exemplo de uma des- 
sas tecnicas, assim como a analise dos fatores 
principals (eixo principal de fatoracao) e a ana¬ 
lise da imagem da covariancia (fatoracao de 
imagem). Desses, a analise dos componentes 
principals e a analise dos fatores principals sao 
os metodos preferidos e geralmente resultam 
em solucoes similares (veja a Secao 15.3.3). 
Quando esses metodos sao usados, as conclu- 
soes estao restritas as amostras coletadas e a 
generalizacao pode ser feita somente se uma 
analise usando diferentes amostras revelar a 
mesma estrutura de fatores. 

Outra abordagem tem sido presumir que 
os participantes sao selecionados aleatoria- 
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mente e que as variaveis medidas constituem 
a populagao de variaveis na qual estamos in- 
teressados. Presumindo isso, e possivel desen- 
volver tecnicas em que os resultados podem 
ser generalizados para uma populagao maior. 
Entretanto, uma restrigao e que qualquer re- 
sultado e verdadeiro somente para o conjunto 
das variaveis medidas (porque assumimos que 
esse conjunto constitui toda a populagao de 
variaveis). Tecnicas nessa categoria incluem 
o metodo de maxima verossimilhanga (veja 
Harman, 1976) e a fatoragao Alfa de Kaiser. 
A escolha do metodo depende de que tipo de 
generalizagao desejamos fazer. 2 

15.3.2 Comunalidades © 

Antes de continual", e importante que voce 
entenda alguns aspectos basicos sobre a va¬ 
riancia dentro de uma matriz-R. E possivel 
calcular a variabilidade dos escores (a varian- 
cia) para qualquer medida dada (ou variavel). 
Voce ja deve estar familiarizado com a ideia 
de variancia e seu calculo (veja o Capitulo 1). 
A variancia total de uma variavel apresenta 
dois componentes: uma parte compartilhada 
com outras variaveis ou medidas (variancia 
comum) e outra parte especifica daquela me¬ 
dida (variancia unica). Iremos utilizar o termo 
“variancia unica” para nos referir a variancia 
que pode ser atribuida, com confianga, a uma 
unica medida ou variavel. Entretanto, existe, 
tambem, a variancia que e especifica de uma 
medida, mas nao tao confiavel; essa variancia 
e chamada de erro ou variancia aleatoria. A 
proporgao da variancia comum presente numa 
variavel e conhecida como comunalidade. 
Assim, a variavel que nao tern uma variancia 
especifica (ou variancia aleatoria) tera uma 
comunalidade de 1; a variavel que nao com- 
partilha sua variancia com qualquer outra va¬ 
riavel tera uma comunalidade de 0. 

Na analise dos fatores, estamos interes- 
sados em encontrar dimensoes subjacentes 


2 Vale a pena notar que a analise de componentes prin¬ 
cipal nao e, de fato, o mesmo que a analise dos fatores. 
Isso nao impede que idiotas como eu as discuta como 
se fossem - voltaremos a esse assunto mais tarde. 


comuns dentro dos dados e, assim, estamos 
principalmente interessados na variancia co¬ 
mum. Portanto, quando executamos uma ana¬ 
lise dos fatores, e fundamental que saibamos o 
quanto da variancia presente em nossos dados 
e a variancia comum. Isso representa um im¬ 
passe logico: para fazer a analise dos fatores 
precisamos saber a proporgao da variancia co¬ 
mum presente nos dados, mas a unica maneira 
de descobrir a extensao da variancia comum 
e executar uma analise dos fatores! Existem 
duas maneiras de abordar esse problema. A 
primeira e assumir que toda a variancia e va¬ 
riancia comum. Assim, assumimos que a co¬ 
munalidade de cada variavel e 1. Fazendo essa 
suposigao, simplesmente transpomos nossos 
dados originais para os componentes lineares 
constituintes (conhecidos como analise de 
componentes principals). A segunda aborda- 
gem e estimar o montante de variavel comum 
estimando os valores da comunalidade para 
cada variavel. Existem varios metodos para 
estimar a comunalidade, mas o mais usado 
(incluindo a fatoragao alfa) e usar a correlagao 
multipla ao quadrado (CMQ) de cada variavel 
com todas as outras. Assim, para os dados de 
popularidade, imagine que voce executou uma 
regressao multipla usando uma medida (Ego- 
ismo) como a safda e as outras cinco medidas 
como previsores: o R 2 multiplo resultante (veja 
a Segao 5.5.2) sera usado como uma estimati- 
va da comunalidade para a variavel Egoismo. 
Essa segunda abordagem e feita na analise de 
fatores. Essas estimativas permitem que a ana¬ 
lise dos fatores seja executada. Uma vez que 
os fatores subjacentes tenham sido extraidos, 
novas comunalidades que representam a corre¬ 
lagao multipla entre cada variavel e os fatores 
extraidos podem ser calculadas. Portanto, a 
comunalidade e uma medida de proporgao da 
variancia explicada pelos fatores extraidos. 

15.3.3 Analise de fatores versus Analise 
de Componentes Principais © 

Acabei de explicar que existem duas abor- 
dagens para localizar dimensoes subjacentes 
de um conjunto de dados: a analise dos fatores 
e a analise dos componentes principais. Essas 
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tecnicas diferem nas estimativas da comunali- 
dade utilizada. De forma simplista, a analise 
dos fatores deriva de um modelo matematico 
em que os fatores sao estimados, enquanto a 
analise dos componentes principals apenas 
decompoe os dados originais em um conjunto 
de variaveis lineares (veja Dunteman, 1989, 
Capftulo 8, para mais detalhes sobre as dife- 
rengas entre os dois procedimentos). Assim, 
somente a analise dos fatores pode estimar 
os fatores subjacentes e ela tem como base 
varias hipoteses para que essas estimativas 
sejam precisas. A analise dos componentes 
principals se preocupa somente em determinar 
que componentes lineares existem dentro dos 
dados e como uma variavel particular pode 
contribuir com aquele componente. Em ter- 
mos de teoria, este capftulo e dedicado mais 
a analise dos componentes principals do que 
propriamente a analise dos fatores. A razao 
e que a analise dos componentes principals e 
um procedimento totalmente psicometrico, ela 
e conceitualmente menos complexa do que a 
analise dos fatores e apresenta muitas simila- 
ridades com a analise discriminante (descrita 
no capftulo anterior). 

Entretanto, devemos considerar se as 
tecnicas fornecem solugoes diferentes para o 
mesmo problema. Baseados em uma extensi- 
va revisao da literatura, Guadagnoli e Velicer 
(1988) conclufram que a solucao gerada pela 
analise dos componentes principals difere um 
pouco daquela derivada da tecnica da analise 
dos fatores. Na realidade, existem algumas 
circunstancias nas quais essa afirmagao nao e 
verdadeira. Stevens (1992) resume os exem- 
plos e conclui que com 30 ou mais variaveis 
e comunalidades maiores do que 0,7 para to- 
das as variaveis, diferentes solugoes sao im- 
provaveis; entretanto, com menos do que 20 
variaveis e com baixas comunalidades (< 0,4) 
podem ocorrer diferengas. 

O lado menos interessante desse argumen- 
to e eloquentemente descrito por Cliff (1987), 
que observou que defensores da analise de 
fatores “insistem que a analise de componen¬ 
tes e, no melhor caso, uma analise de fatores 
comuns com algum erro acrescido e, no pior 


caso, uma bagunga irreconhecfvel de coisas 
das quais nada pode ser determinado” (p. 349). 
Os animos se exaltam nesse assunto, alguns 
argumentando que quando a analise dos com¬ 
ponentes principals for utilizada ela nao deve- 
ria ser descrita como uma analise dos fatores e 
que nao deve atribuir um significado substan- 
tivo aos componentes resultantes. Entretanto, 
para os nao estatfsticos, a diferenga entre um 
componente principal e um fator pode ser di- 
ffcil de conceitualizar (ambos sao modelos li¬ 
neares) e as diferengas surgem principalmente 
nos calculos. 3 



15.3.4 A teoria por tras da Analise de 
Componentes Principais © 

A analise dos componen¬ 
tes principais trabalha de uma 
maneira muito semelhante a 
MANOVA e a analise discri¬ 
minante (veja o capftulo ante¬ 
rior). Embora nao seja necessario entender os 
princfpios matematicos em detalhes, leitores 
do capftulo anterior podem ter se beneficiado 
das comparagoes entre as duas tecnicas. Para 
aqueles que nao leram o capftulo anterior, su- 
giro uma rapida consulta antes de continuar! 

Na MANOVA, varias matrizes SSCP cal- 
culadas continham informagoes sobre os re- 
lacionamentos entre variaveis dependentes. 
Mencionei anteriormente que essas matrizes 
SSCP poderiam ser facilmente convertidas em 
matrizes variancia-covariancia, que apresen- 
tam a mesma informagao, mas em forma de 
media (isto e, levando em conta o numero de 
obscrvagoes). Comentei, tambem, que dividin- 
do cada elemento pelo desvio padrao pertinen- 
te, as matrizes variancia-covariancia se tornam 
padronizadas. O resultado e uma matriz de 
correlagao. Na analise dos fatores, geralmente 


3 Por esse motivo, usei os termos componentes e fatores 
da mesma forma ao longo do capftulo. Embora esse 
uso dos termos injurie alguns estatfsticos (e psicolo- 
gos), aposto que essas pessoas nao irao ler este livro! 
Reconhe^o as diferengas metodologicas, mas e mais 
facil para os estudantes se eu enfatizar as semelhancas 
entre as tecnicas e nao as diferengas. 
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tratamos com matrizes de correlagao (embora 
seja possfvel analisar a matriz de variancia-co- 
variancia tambem) e que essa matriz apresenta 
a mesma informacao que a matriz SSCP na 
MANOVA. A diferenga e apenas que a matriz 
de correlacao e uma versao media da SSCP 
que foi padronizada. 

Na MANOVA, usamos varias matrizes 
SSCP que representam diferentes componen- 
tes da variagao experimental (a variagao do 
modelo e a variagao residual). Na analise de 
componentes principals, a matriz de covarian- 
cias (ou correlagoes) nao pode ser desmem- 
brada dessa maneira (porque todos os dados 
vem do mesmo grupo de participantes). Na 
MANOVA, acabamos olhando para as com¬ 
binagdes lineares ( variates ) ou componentes 
da matriz SSCP que representam a razao entre 
a variancia do modelo e a variancia do erro. 
Essas combinagoes lineares ( variates ) sao di- 
mensoes lineares que separam os grupos tes- 
tados, e vimos que as variaveis dependentes 
foram representadas por esses componentes 
subjacentes. Resumindo, verificamos se os 
grupos poderiam ser separados por uma com¬ 
binagao linear das variaveis dependentes. Es¬ 
sas combinagoes lineares foram encontradas 
calculando os autovetores da SSCP. O numero 
de combinagdes lineares obtido foi menor do 
que p (o numero de variaveis dependentes) ou 
k - 1 (onde teo numero dos grupos). Na ana¬ 
lise de componentes, fazemos algo semelhante 
(estou simplificando um pouco as coisas, mas 
isso lhe dara uma ideia basica). Isto e, pega- 
mos uma matriz de correlagao e calculamos 
as combinagdes lineares. Nao ha grupos de 
observagao, assim, o numero de combinagdes 
lineares obtidas sera sempre igual ao numero 
de variaveis medidas ip). As combinagdes li¬ 
neares sao descritas, como na MANOVA pelos 
autovetores associados a matriz de correlagao. 
Os elementos dos autovetores sao os pesos 
de cada variavel na combinagao linear (veja a 
Equagao 14.5). Esses valores sao as cargas dos 
fatores descritas anteriormente. O maior auto¬ 
valor associado com cada um dos autovetores 
fomece um indicador linico da importancia de 
cada combinagao linear (ou componente). A 



ideia basica e retermos fatores com autovalo- 
res relativamente grandes e ignoramos aqueles 
com autovalores relativamente pequenos. 

Resumindo, a analise de 
componentes trabalha de uma 
maneira similar a MANOVA. 
Comegamos com uma matriz 
representando os relaciona- 
mentos entre variaveis. Os componentes line¬ 
ares (tambem chamados de combinagdes line¬ 
ares ( variates ) ou fatores) daquela matriz sao, 
entao, calculados pela determinagao dos auto¬ 
valores da matriz. Esses autovalores sao usa- 
dos para calcular os autovetores, os elementos 
que fornecem as cargas de uma variavel ou um 
fator em particular (isto e, eles sao os valores 
b na equagao (15.1)). O autovalor e, tambem, 
uma medida da importancia do autovetor com 
o qual ele esta associado. 


15.3.5 Extragao de fatores: autovalores 
e o diagrama de inclinagao © 



Nem todos os fato¬ 
res sao extrafdos numa 
analise e existe um de¬ 
bate sobre os criterios 
usados para decidir 
se um fator e estatis- 
ticamente importante. 

Mencionei acima que 
os autovalores associa¬ 
dos a uma combinagao linear ( variate ) indicam 
a importancia daquele fator. Portanto, parece 
logico que devem ser retidos somente fatores 
com autovalores grandes. iMMMWH 
um autovalor e suficientemente grande ou nao 
para representar um fator significativo? Bern, 

uma tecnica advogada por Cattell (1966b) e 
tragar um grafico de cada autovalor (eixo-y) 
contra o fator com o qual ele esta associado 

MBK 1 sscli: i- al iVi iTcti . i IrTtw id'nicniuptufti 
diagrama de declividade. Mencionei anterior- 


to as variaveis existentes, e que cada uma tern 

um auto valor associado. Representando num 
grafico os autovalores, a importancia relativa 
de cada fator se torna aparente. Tipicamente, 
existirao alguns fatores com autovalores bem 
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altos e muitos fatores com autovalores relati- 
vamente baixos, assim, esse grafico tem uma 
forma caracterfstica: uma inclinagao bem 
acentuada na curva seguida de uma cauda 
quase horizontal (veja a Figura 15.2). ^attef§ 

selecionar fatores deveria ser no ponto de in- 

flexao dessa curva. Com uma amostra de mais 
de 200 participantes, o diagrama de declivida- 
de fornece um criterio bastante confiavel para 

Embora 

apenas nesse criterio. Kaiser (1960) recomen- 
dou reter todos os fatores com autovalores 
maiores do que 1. Esse criterio e baseado na 
ideia de que autovalores representam o mon- 
tante de variactio explicada por um fator e que 
um autovalor de 1 representa um substancial 
montante de variagao. Jolliffe (1972-1986) 
relata que o criterio de Kaiser e muito rfgido 
e sugere a terceira opgao para reter todos os 
fatores com autovalores maiores do que 0,70. 
A diferenga entre quantos fatores serao retidos 
utilizando os metodos de Kaiser comparado 
ao de Jolliffe pode ser enorme. 

Voce pode querer saber como os tres me¬ 
todos se comparam. De modo geral, pesquisas 
tem demonstrado que o criterio de Kaiser e 
preciso quando o numero de variaveis e me- 


nor do que 30 e as comunalidades resultantes 
(apos a extragao) sao todas maiores do que 
0,7. O criterio de Kaiser e, tambem, preciso 

e a media da comunalidade e maior ou igual 
a 0,6. Em qualquer outra circunstancia, e 
melhor voce usar o diagrama de declividade 
desde que o tamanho da amostra seja maior 

do que 200 (veja Stevens, 1992, p. 378-380 

o criterio de Kaiser para extrair fatores. Por- 

para determinar quantos fatores serao retidos, 

devera executar novamente a analise especifi- 
cando que o SPSS extraia o numero de fatores 
que voce deseja. 

Entretanto, como e geralmente o caso em 
estatistica, os tres criterios geralmente fornecem 
diferentes solugoes! Nessas situagoes, as comu¬ 
nalidades dos fatores devem ser consideradas. 
Na analise dos componentes principals, come- 
gamos com comunalidades de 1 com todos os 
fatores retidos (porque assumimos que toda a 
variancia e comum). Nesse estagio, encontra- 
mos as combinagdes lineares que existem nos 
dados - assim, transformamos os dados sem 
descartar informagao alguma. Entretanto, para 
descobrir qual e a variancia comum que real- 
mente existe entre as variaveis, devemos decidir 
quais fatores sao significativos e descartar os ir- 



Figura 15.2 Exemplo de um diagrama de declividade para dados com apenas um fator subjacente. 
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relevantes. Portanto, descartamos alguma infor- 
macao. Os fatores que retemos nao irao explicar 
toda a variancia dos dados (porque descartamos 
alguma informagao), assim, as comunalidades 
apos a extragao serao sempre menores do que 
1. Os fatores retidos nao correspondem perfei- 
tamente as variaveis originals - eles apenas re- 
fletem a variancia comum presente nos dados. 
Se as comunalidades representam a perda de 
informagao, elas sao estatfsticas importantes. 
Quanto mais proximas as comunalidades estao 
de 1, melhor os fatores explicarao os dados ori¬ 
ginals. E logico que quanto mais fatores retidos, 
maiores serao as comunalidades (porque menos 
informagao e descartada); portanto, as comuna¬ 
lidades sao bons indices para verificar se pou- 
cos fatores foram retidos. Na verdade, com a 
andlise dos fatores por mmimos quadrados ge- 
neralizados e a andlise dos fatores por maxima 
verossimilhanga, voce consegue uma medida 
estatistica da aderencia da solugao dos fatores 
(veja o proximo capitulo para mais testes de 
aderencia). Isso basicamente mede a proporgao 
da variancia que a solugao por fatores explica 
(assim, pode ser pensado como uma compara- 
gao de comunalidades antes e apos a extragao). 


Um conselho final: a sua decisao de quan- 
tos fatores extrair tambem dependera de por que 
voce esta fazendo a analise em primeiro lugar 
(por exemplo, se voce esta tentando superar pro- 
blemas de multicolinearidade na regressao, sera 
melhor extrair mais fatores do que menos). 

15.3.6 Melhorando a interpretacao: a 
rotagao de fatores (D 

Depois de extrair os fatores, e possivel 
calcular em que grau as variaveis se adaptam 
a esses fatores (isto e, calcular a carga da va- 
riavel em cada fator). 

brira que a maioria das variaveis tem cargas 
altas no fator mais importante e cargas baixas 
nos demais fatores. Essa caracteristica tor- 
na a interpretagao dificil, assim, uma tecnica 
chamada de rotaqdo de fatores e usada para 
fazer a distingao entre fatores. Se um fator 

for um eixo classificatorio ao longo do qual 
as variaveis podem ser tragadas, a rotagao dos 
fatores gira esses eixos de modo que as varia¬ 
veis estejam carregadas ao maximo somente 
em um fator. A Figura 15.3 demonstra como 
esse processo funciona usando um exemplo 
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Figura 15.3 Representagao esquematica da rotagao de fatores. 0 grafico da esquerda mostra a 
rotagao ortogonal, enquanto o grafico da direita mostra a rotagao obliqua (veja o texto para mais 
detalhes). 0 e o angulo pelo qual os eixos giram. 


















Descobrindo a Estatistica Usaimdo o SPSS 567 


no qual ha somente dois fatores. Imagine que 
uma sociologa esta interessada em classificar 
professores universitarios como um grupo de- 
mografico. Ela descobriu que apenas duas di- 
mensoes subjacentes descrevem melhor esse 
grupo: alcoolismo e realizagao (va a qualquer 
conferencia e voce vera que academicos be- 
bem muito!). O primeiro fator, alcoolismo, 
tern um aglomerado de variaveis associadas a 
ele (pontos pretos) e essas podem ser medi- 
das, como o numero de unidades bebidas em 
uma semana, dependencia e personalidade ob- 
sessiva. O segundo fator, realizable, tambem 
tem um aglomerado de variaveis associadas a 
ele (pontos claros) e essas podem ser medidas 
relacionadas a salario, status no emprego e 
numero de pesquisas publicadas. Inicialmen- 
te, as linhas cheias representam os fatores, e 

olhando para as coordenadas deveria ficar cla- 
ro que os pontos claros tem cargas altas para 

o fator 2 (eles estao bent alto no eixo) e car- 
gas medias no fator 1 (elas nao estao muito 

longe desse eixo). Contrariamente, os pontos 

medias para o fator 2. Girando os eixos (linhas 
pontilhadas), asseguramos que ambos os aglo- 
merados de variaveis tenham uma intersecao 

ielo fator com o qual mais se relacionam. 

avers 

sao maximizadas sobre um fator (o fator que 
IBIIMM 

fator(es) remanescente(s). Se um eixo passar 

atraves de um aglomerado de variaveis, essas 
variaveis terao uma carga de aproximadamen- 
te 0 no eixo oposto. Se essa ideia e confusa, 

das 

coordenadas antes e apos a rotagao (isso e me- 
lhor visn aliW^MH^^rid^MjJl^glllHlferiilllil^EaBHMMil voce 
olha para os eixos que foram girados). 

ser feitos. O primeiro e a rotagao ortogonal, 

e o lado esquerdo 

esse metodo. No Capftulo 8, vimos que o ter- 
mo “ortogonal” significa nao-relacionado e, 
nesse contexto, ele significa que rotamos os 

fatores enquanto os mantemos independentes. 

Antes da rotagao todos os fatores sao indepen¬ 
dentes (isto e, eles nao se relacionam de ma- 


neira alguma) e a rotagao ortogonal assegura 
que os fatores permanegam nao-relacionados. 
Isso ocorre porque na Figura 15.3 os eixos sao 
girados enquanto permanecem perpendicu- 
lares 4 . A outra forma de rotagao e a rotagao 

obllqua. Adiferenga da rotagao obllqua pque 
os fatores podem se relacionar (por essa razao, 

I8M9Sri lio ■Sferrn an 

te uma boa razao teorica para supor que os 
fatores estejam relacionados ou que sejam 

independentes (veja meus proximos comen- 

tarios sobre esse assunto) e, tambem, como 

as variaveis se aglomeram nos fatores antes 

da rotagao. No primeiro ponto, nao podemos 
esperar que alcoolismo seja completamente 

■ijffl &BSItf mg&g&li ai i/i3yK &‘ n'di?\ i 
realizagoes levam a um alto nlvel de estresse, 
o qual leva a bebida!). Portanto, teoricamente 
devemos escolher a rotagao obllqua. No se¬ 
gundo ponto, a Figura 15.3 demonstra como o 
posicionamento dos aglomerados e importan- 
te para determinar o sucesso da rotagao (note a 
posigao dos pontos escuros). Especificamente, 
se uma rotagao ortogonal fosse executada no 
diagrama do lado direito, ela teria considera- 
velmente menos sucesso na maximizagao das 
cargas do que a rotagao obllqua que e mos- 
trada. Uma abordagem e executar a analise 
usando ambos os tipos de rotagao. Pedhazur 
i tS'Jini l 1 k“in5(jfIf*J j| ^(iivn litiui^sG i mljiooj 
obllqua demonstra uma correlagao desprezl- 
vel entre os fatores extraldos, e razoavel usar 

a rotagao ortogonal. Se a rotagao obllqua re¬ 
vela uma estrutura de fatores correlacionada, 
a solugao ortogonal deve ser descartada. De 
qualquer modo, uma rotagao obllqua somente 
deve ser usada se existem boas razoes para su¬ 
por que os fatores subjacentes pocLeriam estar 
relacionados em termos teoricos. 

A matematica por tras da rotagao dos fa¬ 
tores e complexa (especificamente a rotagao 
obllqua). Entretanto, na rotagao obllqua, por¬ 
que cada fator pode ser rodado por diferentes 


4 Esse termo significa que os eixos formam um angulo 
reto entre si. 
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valores uma matriz de rotagao dos fatores, 
A, ela e necessaria. A matriz de rotagao dos 
fatores e quadrada e seu tamanho depende de 
quantos fatores foram extrafdos dos dados. Se 
dois fatores foram extrafdos, ela sera uma ma¬ 
triz 2x2, mas se quatro fatores foram extraf¬ 
dos, ela se torna uma matriz 4x4. Os valores 
da matriz de rotagao dos fatores consistem em 
senos e cossenos do angulo de rotagao (0). 
Essa matriz e multiplicada pela matriz das car- 
gas dos fatores nao rotacionados A, para obter 
a matriz de cargas dos fatores rotacionados. 

Para o caso de dois fatores, a matriz de 
rotagao dos fatores seria: 

* /cos 0 — send\ 

\sen8 cos 9 ) 

Portanto, voce deve pensar nessa matriz 
como representando o angulo no qual os ei- 
xos foram girados ou o grau no qual os fato¬ 
res foram rotacionados. O angulo da rotagao 
necessario para otimizar a solugao dos fatores 
e encontrado de forma interativa, e metodos 
diferentes podem ser usados. 

15.3.6.1 Escolhendo um metodo de 
rotagao dos fatores ® 

©EBSSitem$igs mefqdos'de rotagaoortO;i 
gonal ( varimax , quartimax e equamax) e dois 
metodos de 

promax). Esses metodos diferem na forma de 
rodar os fatores e, portanto, a safda resultante 
dependent do metodo selecionado. A rotagao 
quartimax tenta maximizar a dispersao da 

carga dos fatores de uma variavel por todos 
os fatores. Portanto, se torna mais facil inter¬ 

pretar as variaveis. Entretanto, isso geralmente 
resulta em muitas variaveis com altas cargas 

em um unico fator. O varimax e o oposto dis- 

so, ele tenta maximizar a dispersao das cargas 
dentro dos fatores. Portanto, ele tenta agregar 
um menor numero de variaveis sobre cada fa- 
tor resultando em mais aglomerados de fatores 

QBfflSIifiBjifflfflS&MMquamax e um hfbrido das 
outras duas abordagens e existem relatos de 
que ele apresenta um comportamento bastante 

erratico (veja Tabachnick e Fidell, 2 (11 Para 


uma primeira analise, voce deve selecionar o 

varimax, pois ele e uma ^a abbiiSgem^^® 
que simplifica a interpretagao dos fatores. 

^p^So oblfqua e mais complexa porque 
nela a correlagao entre fatores e permitida. No 

mitida a correlagao dos fatores e determinado 
pelo valor de uma constante chamada delta. O 
valor por omissao no SPSS e zero e isso assegu- 
ra que uma alta correlagao entre os fatores nao 
seja permitida (isso e conhecido como a rotagao 
quartimin direta). Se voce optar por um delta 

pere fatores altamente correlacionados; se voce 
estabelecer um delta menor do que zero (ate um 
mfnimo de —0,8), espere fatores menos correla- 

maioria das analises e eu nao recomendo troca- 

(veja Pedhazur e Schmelkin, 1991, p. 620). O 

tado para grandt ^jgflilffllitMB8g^^M 

Teoricamente, a escolha exata de rotagao 

dependera muito de se voce acha ou nao que 
os fatores subjacentes estao relacionados. Se 

voce espera que os fatores sejam independen- 
tes, deve escolher uma das rotagbes ortogonais 
(recomendo a varimax). Se, entretanto, exis¬ 

tem fundamentagoes teoricas para sustentar 
que seus fatores possam estar correlacionados, 

a oblimin direta deve ser selecionada. Na pra- 
tica, existem fortes indicios de que as rotagbes 
ortogonais nao fazem sentido para dados natu- 
ralistas e para qualquer dado envolvendo hu- 
manos (voce pode pensar em algum construto 
psicologico que nao esteja de maneira alguma 
correlacionado com qualquer outro constru¬ 

to?). Desse modo, alguns argumentam que as 
rotagbes ortogonais nunca devem ser usadas. 

15.3.6.2 Importancia da carga dos 
fatores © 

Uma vez que a estrutura dos fatores foi en- 
contrada, e importante decidir quais variaveis 
compoem cada um dos fatores. Anteriormen- 
te, afirmei que as cargas dos fatores eram uma 
medida de substancial importancia de uma de- 
terminada variavel em relagao a um dado fator. 
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Portanto, faz sentido que usemos esses valores 
para atribuir variaveis aos fatores. E possrvel 
acessar a significancia estatistica da carga de 
um fator (afinal, ela e simplesmente um coe- 
ficiente de correlaqao ou de regressao); entre- 
tanto, essa op£ao nao e tao facil quanto parece 
(veja Stevens, 1992, p. 382). Tipicamente, os 
pesquisadores consideram uma carga de valor 
absoluto maior do que 0,3 como sendo impor- 
tante. Entretanto, a significancia de uma carga 
do fator dependera do tamanho da amostra. 
Stevens (1992) produziu uma tabela de valo¬ 
res criticos com os quais as cargas podem ser 
comparadas. Resumindo, ele recomenda que 
para um tamanho da amostra de 50, uma car- 
(g jMv'J ty;d’!j|'Vode sci considerada significativa, 

para 200, ela deve ser maior do que 0,364, para 
100, ela deve ser maior do qu6 0,298, para 6QP, 

ela deve ser maior db0[^BH£SIiss&s valores 
sao bascados mum nfvel alfa de 0,01 (bilateral) 
que permite o fato de que varias cargas preci- 

84 para maiores detalhes). Portanto, em amos- 
tras muito grandes, cargas pequenas podem ser 
consideradas estatisticamente significativas. O 
SPSS nao fornece testes de significancia para 
a carga dos fatores, mas aplicando as diretrizes 
de Stevens voce deve ter algum esclarecimento 

sobre a estrutura das variaveis e fatores. 

A significancia de uma carga nao mostra 
a importancia de uma variavel para um fator. 

quadrado a carga do fator para uma estimativa 
do montante da variancia num fator de respon- 
sabilidade daquela variavel (como R 2 ). A esse 

respeito, Stevens (1992) recomenda interpre¬ 
tar somente cargas dos fatores com um valor 
absoluto maior do que 0,4 (o que explicaria 
por volta de 16% da variancia da vaffa vgjU 

15.4 EXEMPL0 DE PESQUISA © 

A analise dos fatores e usada para de- 
senvolver questionarios: afinal, se voce quer 
medir uma habilidade ou caracterfstica, deve 
assegurar que as perguntas feitas estejam re- 


lacionadas ao construto que deseja medir.' 

Notei que muitos estudantes se interessam 
pelo SPSS. Portanto, projetei um questiona¬ 
rio para medir uma caracterfstica que deno- 
minei “ansiedade com o SPSS”. Planejei um 
questionario para medir os varios aspectos da 
ansiedade dos alunos com o SPSS. Elaborei 
perguntas baseadas em entrevistas com es¬ 
tudantes com ansiedade e sent ansiedade e 
terminei com 23 perguntas possfveis. ; Cada 
pergunta era uma afirmagao avaliada por 
uma escala de Likert de cinco pontos inician- 
do com “discordo totalmente” passando por 
“nao concordo nem discordo” e finalizando 
em “concordo plenamente”. O questionario e 

O questionario foi projetado para prever 
quao ansioso um determinado indivfduo esta- 

ria em aprender a usar o SPSS. Tambem queria 
saber se a ansiedade em rela§ao ao SPSS po- 
deria ser desm ^BMEIJiMMWiiMilMiSMMl 
de ansiedade. Assim, em outras palavras, que 
outras variaveis latentes contribuem para a an¬ 

siedade Com a ajuda de alguns 

rios completos (obviamente, esse exemplo e 

fictfcio!). Os dados estao armazenados no ar- 
quivo SAQ.sav. Carrcgue o conjunto de dados 
no editor de dados do SPSS e de uma olhada 
nas variaveis e suas propriedades. Note que 
cada pergunta (variavel) e representada por 
uma coluna diferente. Sabemos que os casos 
no SPSS (ou dados de pessoas) sao armazena¬ 
dos em linhas e as variaveis sao armazenadas 
em colunas, assim, essa disposiqao e consis- 
tente com os capftulos anteriores. Observe 
tambem que existem ^j^ aM^i^otulll Mfiii 
q, a q 23 e que cada uma tem um rotulo indi- 
cando a pergunta. Ao rotular minhas variaveis, 
posso ser bent claro sobre o que cada variavel 
representa (essa e a vantagem de dar tftulos as 
suas variaveis e nao apenas utilizar os cabeca- 
lhos restritivos das colunas). 


5 Incluf um arquivo no material disponivel no site cha- 
mado de DesigningQuestionnaires.pdf (projetando 
questionarios), que fornece alguns conselhos sobre o 
processo de desenvolvimento de questionarios. 
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DT 

= Discordo Totalmente, D = Discordo, N = Nem discordo, nem concordo, C 

= Concordo, CT 

= 

Concordo Totalmente 

DT 

D 

INI 

c 

CT 

01. 

A estatistica me faz chorar. 

O 

o 

O 

o 

o 

02. 

Meus amigos irao pensar que sou estupido por nao 
saber mexer com o SPSS. 

O 

o 

O 

o 

o 

03. 

Desvios padrao me excitam. 

o 

o 

o 

o 

o 

04. 

Eu sonho com Pearson me atacando com coeficientes 
de correlagao. 

o 

o 

o 

o 

o 

05. 

Eu nao entendo estatistica. 

o 

o 

o 

o 

o 

06. 

Eu tenho pouca experiencia com computadores. 

o 

o 

o 

o 

o 

07. 

Todos os computadores me odeiam. 

o 

o 

o 

o 

o 

08. 

Eu nunca fui bom em matematica. 

o 

o 

o 

o 

o 

09. 

Meus amigos sao melhores em estatistica do que eu. 

o 

o 

o 

o 

o 

10. 

Os computadores sao uteis somente para jogos. 

o 

o 

o 

o 

o 

11. 

Eu fui muito mal em matematica na escola. 

o 

o 

o 

o 

o 

12. 

Dizem que o SPSS torna a estatistica mais facil de 
entender, mas isso nao e verdade. 

o 

o 

o 

o 

o 

13. 

Estou com medo de provocar danos irreparaveis por 
causa da minha incompetencia com computadores. 

o 

o 

o 

o 

o 

14. 

Computadores tern suas proprias mentes e 
deliberadamente erram quando eu os uso. 

o 

o 

o 

o 

o 

15. 

Computadores existem para me sacanear. 

o 

o 

o 

o 

o 

16. 

Eu choro escancaradamente quando ougo falar em 
tendencia central. 

o 

o 

o 

o 

o 

17. 

Eu entro em coma toda vez que vejo uma equagao. 

o 

o 

o 

o 

o 

18. 

O SPSS sempre trava quando eu tento usa-lo. 

o 

o 

o 

o 

o 

19. 

Todos olham para mim quando uso o SPSS. 

o 

o 

o 

o 

o 

20. 

Eu nao consigo dormir quando penso em autovetores. 

o 

o 

o 

o 

o 

21. 

Eu tenho pesadelos com a distribuigao normal. 

o 

o 

o 

o 

o 

22. 

Meus amigos sao melhores com o SPSS do que eu. 

o 

o 

o 

o 

o 

23. 

Eu sou bom em estatistica e as pessoas acham que 
sou CDF. 

o 

o 

o 

o 

o 


Figura 15.4 O questionario sobre ansiedade do SPSS (QAS). 


15.4.1 Primeiras consideracoes © 

15.4.1.1 Tamanho da amostra © 

Os coeficientes de correlagao flutuam 
de amostra para amostra, mais em peque- 
nas amostras do que em grandes. Portanto, a 
confiabilidade da analise dos fatores depende 
tambem do tamanho da amostra. Muito ja foi 
escrito sobre o tamanho da amostra neces- 
sario para a analise de fatores, resultando em 
diversas “regras praticas”.(A regra comum e 
sugerir que o pesquisador tenha pelo menos 
entre 10 e 15 participantes por variave| (No 
entanto, a base empirica dessa regra nao esta 
Midi t"‘'i'nen'd3 T iei , jg|j'!fc e/e>. 


mais participantes do que variaveis). Kass e 

Tinsley (1979) recomendam ter entre 5 e 10 
participantes por variavel ate um total de 300 
(alem do que os testes parametricos tendem 
a se estabilizar nao importando a proporgao 
entre participantes e variaveis). Na verdade, 
Tabachnick e UdiU, gfll l concordant que 
“e confortante ter pelo menos 300 casos para 

como excelente. 

Felizmente, nos ultimos anos muitas pes- 
quisas foram feitas na forma de experimen- 
tos usando dados simulados (chamados de 
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estudos de Monte Carlo). Arrindell e van der 
Ende (1985) usaram dados reais para investi- 
gar o efeito de diferentes participantes a fim 
de determinar a razao entre duas variaveis. 
Eles conclufram que mu dang as dessa razao 
fizeram pouca diferenca para a estabilidade 
das solucoes dos fatores. Mais recentemente, 
Gudagnoli e Velicer (1998) descobriram que o 
mais importante para determinar solucoes de 
fatores confiaveis era o tamanho da amostra e 
a magnitude absoluta das cargas dos fatores. 
Resumindo, eles argumentam que se um fa- 

tor tern quatro ou mais cargas maiores do que 

0,6 ele e confiavel a 

amostra. Alem disso, fatores com 10 ou mais 

mente, fatores com poucas cargas baixas nao 

devem ser interpretados a nao ser que o tama¬ 

nho da amostra seja de no mmimo 300. Mais 
recentemente, MacCallum, Widaman, Zhang 
e Hong (1999) mostraram que o tamanho da 
amostra mmimo ou a razao entre o tamanho da 
amostra e o numero de variaveis depende en¬ 
tre outros aspectos do projeto do estudo. Seu 
estudo indicou que a medida que as comuna- 
lidades se tornam mais baixas, a importancia 
do tamanho da amostra aumenta. Com todas 
as comunalidade acima de 0,6, tamanhos de 
amostras relativamente pequenos (menores do 
que 100) podem ser perfeitamente adequados. 
Com comunalidades na faixa de 0,5, amostras 
entre 100 e 200 podem ser boas o suficiente 
desde que cada uma tenha relativamente pou- 
cos fatores com somente um pequeno numero 
de variaveis indicadoras. No pior cenario, de 
baixas comunalidades (bem abaixo de 0,5) e 
uma grande quantidade de fatores subjacentes, 
eles recomendam amostras acima de 500. Fica 
claro a partir deste trabalho que uma amostra 
de 300 ou mais provavelmente fornecera uma 
solucao de fatores estavel, mas um pesquisa- 
dor esperto medira variaveis o suficiente para 
avaliar adequadamente todos os fatores que 
teoricamente ele esperaria encontrar. 

Outra alternativa e usar a medida de ade- 
quacao da amostra de Kaiser-Meyer-Olkim 
(KMO) (veja Kaiser, 1970). A KMO pode ser 


calculada para variaveis individuals e multiplas 
e representa a razao da correlagao ao quadra- 
do para a correlagao parcial ao quadrado entre 
as variaveis. A estatistica KMO varia entre 0 
e 1. Um valor de 0 indica que a soma de cor- 
relacoes parciais e grande relativa a soma das 
correlates, indicando difusao no padrao das 
correlates (portanto, a analise de fatores pro¬ 
vavelmente e inadequada). Um valor proximo 
de 1 indica que padroes de correlates sao re¬ 
lativamente compactos, assim, a analise de fa¬ 
tores deveria dar preferencia a valores distintos 
e confiaveis. Kaiser (1974) recomenda valores 
maiores do que 0,5 como sendo apenas aceita- 
veis (valores abaixo disso deveriam levar voce 
a coletar mais dados ou repensar quais varia¬ 
veis incluir). Alem disso, valores entre 0,5 e 0,7 
sao medfocres, valores entre 0,7 e 0,8 sao bons, 
valores entre 0,8 e 0,9 sao otimos e valores aci¬ 
ma de 0,9 sao excelentes (veja Hutcheson e So- 
froniou, 1999, p. 224-225 para mais detalhes). 

15.4.1.2 Vasculhando os dados © 

Neste livro, usei a expressao “se entrar 
lixo, sai lixo”. Essa expressao se aplica par- 
ticularmente a analise dos fatores porque o 
SPSS ira sempre encontrar uma solugao para 
um conjunto de variaveis. Entretanto, e impro- 
vavel que a solugao tenha qualquer significado 
real se as variaveis analisadas nao sao sensf- 
veis. Quando conduzir uma analise de fatores, 
primeiro analise a intercorrelagao entre as va¬ 
riaveis. Se as perguntas do seu teste medem a 
mesma dimensao subjacente (ou dimensdes), 

esperamos que elas se correlacionem (porque 
elas estao medindo a mesma coisa). Mesmo se 
as . fiBBtunuts fried ire nr flilcrcntes'aspgfctos-d&Si 
mesmas coisas (por exemplo, poderfamos me- 
dir a ansiedade de modo geral em termos de 
subcomponentes, como preocupagao, pensa- 
mentos intrusivos e excitagao psicologica) de¬ 
veria, ainda, haver altas intercorrelagdes entre 
as variaveis relacionadas a essas subcaracte- 
rfsticas. Se voce encontrar quaisquer variaveis 
que nao se correlacionam com outras varia¬ 

veis (ou com pouqufssimas), deve considerar 
a exclusao dessas variaveis antes da analise 
de fatores ser executada. Um extremo desse 
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se assemelha a uma matriz identidade (veja a 
Se 9 ao 14.3.2). Nesse caso, as variaveis se cor- 
relacionam somente com elas mesmas e todos 
os outros coeficientes de correlacao estao pro- 
ximos de zero. O SPSS testa isso usando o tes¬ 
te de esfericidade de Bartlett (veja a proxima 
secao). As correlates entre variaveis podem 
ser checadas usando o procedimento correlate 
(correlacao) (veja o Capitulo 4) para criar uma 
matriz de correlates de todas as variaveis. A 
matriz tambem pode ser criada como parte da 
analise dos fatores principal. 

O problema oposto e quando as varia¬ 
veis sao altamente correlacionadas. Embora 
a multicolinearidade moderada nao seja um 
problema para a analise de fatores, e impor- 
tante evitar a multicolinearidade extrema (isto 
e, variaveis altamente correlacionadas) e sin- 
gularidade (variaveis que estao perfeitamente 
correlacionadas). Assim como na regressao, a 
singularidade causa problemas na analise de 
fatores porque se torna imposslvel determinar 
a contribuicao unica para um fator se as va¬ 
riaveis estao altamente correlacionadas (como 
foi o caso para regressao multipla).iPortanto, 
nesse estagio inicial, queremos eliminar qual- 
quer variavel que nao se correlacione com 

qualquer outra variavel ou que seja altamente 
correlacionada com outras variaveis (R > 0,9). 
A multicolinearidade pode ser detectada ve- 


rificando o determinante da matriz-R (veja a 
proxima segao). 

Alem de procurar por interrelates, voce 
deve se assegurar que as variaveis tenham 
distributors aproximadamente normais e 
que sejam medidas pelo menos em um nivel 
de intervalo (supoe-se, erroneamente, que 
as escalas de Likert o sejam!). A hipotese de 
normalidade e mais importante se voce deseja 
generalizar os resultados da sua analise alem 
dos dados coletados. 

15.5 EXECUTANDO A ANALISE © 

Acesse a caixa de dialogo principal (Fi- 
gura 15.5) utilizando o menu Analyze=>Data 
Reduction=>Factor..., (Analisar=>Redu 5 ao 
de Dados=>Fator...), selecione as variaveis 

excluir qualquer variavel identificada como 
problematica durante a selecao dos dados) e 
transfira-as para a caixa Variables (Variaveis) 
clicando em )ZJ. 

Existem vMas optes dispomveis, a pri- 
meira de las pode ser selecionada clicando em 
Iceacfipiiws.-. (Descritivas) para acessar a caixa 

15.6. A opto 

riadas) fornece medias e desvios padrao para 
cada variavel. A maioria das outras opcoes se 

referem a matriz de correlacao das variaveis 



Figura 15.5 Caixa de dialogo principal para a analise dos fatores. 
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Figura 15.6 Descritivas em analise dos fatores. 


(a matriz-R descrita anteriormente). A opgao 

e a opgao Significance levels (Nrveis de sig- 
nificancia) ira produzir uma matriz indicando 
o valenific anci a cle c ada c i \j r<. I al .u) da 

terminant (Determinante) dessa matriz e essa 

ou singularidade. O determinante da matriz- 

nor do que esse valor, verifique na matriz de 

correlates as variaveis que se correlacionem 

altamente (R > 0,8) e considere eliminar uma 
dessas variaveis (ou mais, dependendo da ex- 
tensao do problema) antes de continuar. Como 

foi nrencionado na Sega° 6.8, a escolha de 

ria e encontrar multicolinearidade nos dados 
deve levantar questoes sobre a escolha dos 

itens do seu questionario. 

O KMO and Bartlett’s test of sphericity 

produz o KMO e o teste de Bartlett. Com uma 
amostra de 2571 nao devemos nos preocu- 
par com o tamanho da amostra (veja a Segao 

15.4.1.1) . Ja abordamos o KMO (veja a Segao 

15.4.1.1) e vimos os varios criterios de ade- 
quagao da amostra. Tambem vimos o teste de 
Bartlett no Capitulo 14: ele examina se a ma¬ 
triz de correlates da populate se parece com 
uma matriz de identidade (isto e, se ela testa se 
os componentes fora da diagonal sao zero).(gt 
a matriz de correlacao da populate se parece 
com a matriz de identidade, isso significa que 


cada variavel se correlaciona pessimamente 

com todas as outras variaveis (isto e, todos 
os coeficientes de correlacao estao proximos 

de zero). Se tivessemos uma matriz identida¬ 
de, isso significaria que todas as variaveis sao 
perfeitamente independentes (todos os coefi¬ 
cientes de correlacao seriam zero). Dado isso, 
procuramos por aglomeracdes de variaveis 
que megam coisas similares, e deveria ser ob- 

vio o porque desse cenario ser problematico: 
se nenhuma das variaveis se correlaciona, nao 
existem aglomerados para encontrar. 

produz uma matriz de correla^oes baseada no 

entre a matriz baseada no modelo e a matriz 
baseada nos dados observados indicam os re- 
siduosi df> modchritisi;.leH,lm niiya'. iSO SPSS 
produz esses reslduos na tabela inferior da 
matriz reproduzida, e queremos que relativa- 
mente poucos desses valores sejam maiores 

do 0,05. Felizmente, para nos salvar de vascu- 

Reproduced (Reproduzida) deve estar sele- 
cionada para obter esse resumo. A oppao An¬ 
ti-image (Anti-imagem) produz uma matriz 
anti-imagem das covariancias e correlagoes. 
Essas matrizes contem medidas de adequacao 

gonal e os opostos da correlagao/covariancias 
parciais fora das diagonals. Os elementos dia¬ 
gonals, como o KMO, devem ser maiores do 
que 0,5, no mmimo, se a amostra for adequada 
para um determinado par de variaveis dado. 
Se qualquer par de variaveis apresenta um 
valor menor do que esse, considere a retirada 
de uma das variaveis da analise. Os elemen¬ 
tos fora da diagonal devem ser todos bem pe- 
quenos (proximos a zero) num bom modelo. 
Quando voce tiver terminado com essa caixa 
de dialogo, clique em (Continuar) para 
retornar a caixa de dialogo principal. 

15.5.1 Extragao de fatores no SPSS © 

Para acessar a janela de dialogo Extration 
(Extragao), clique em Ext,a<!ll ° n (Figura 15.7) 
na caixa de dialogo principal. Existem varias 
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Figura 15.7 Caixa de dialogo para a extragao de fatores. 


maneiras de conduzir uma analise dos fatores 
(veja a Segao 15.3.1) e quando e onde voce 
usa os varios metodos depende de varios fa¬ 
tores. Para nossos propositos, iremos usar a 
analise dos componentes principals , que nao 
e exatamente analise de fatores, mas os dois 
procedimentos, geralmente, conduzem a re- 
sultados semelhantes (veja a Segao 15.3.3). 

Na caixa Analyze (Analisar), existem 
duas opgoes: analisar a matriz de correla- 
goes (Correlation matriz) ou analisar a 
matriz de covariancia (Covariance matrix). 
Voce deveria estar feliz com a ideia de que 
essas duas matrizes sao realmente diferen- 
tes versoes do mesmo: a matriz de correla¬ 
gao e uma versao padronizada da matriz de 
covariancia. Analisar a matriz de correlagao 
e um metodo padrao util porque ele assume 
a forma padronizada da matriz; portanto, se 
as variaveis foram medidas usando diferen- 
tes escalas, isso nao afetara a analise. Nesse 
exemplo, todas as variaveis foram medidas 
usando a mesma escala de medida (a escala 
de cinco pontos de Likert), mas, geralmente, 
voce vai querer analisar variaveis que usam 
diferentes escalas de medidas. Analisar a ma¬ 
triz de correlagao assegura que diferengas em 
escalas de medidas sejam consideradas. Alem 
disso, mesmo variaveis medidas usando a 
mesma escala podem ter variancias bem di¬ 
ferentes, e isso tambem cria problemas para 
a analise dos componentes principais. Usar a 
matriz de correlagao elimina esse problema. 
Existem razoes estatfsticas para preferir ana¬ 


lisar a matriz de covariancias 6 ,e geralmente 
os resultados irao diferir da analise na matriz 
de correlagao. Entretanto, a matriz de covari¬ 
ancia deve ser analisada somente quando as 
variaveis sao comensuraveis. 

A caixa Display (Apresentar) tem duas 
opgoes: solugao dos fatores nao-rotacionados 
(Unrotated factor solution) e o diagrama de 
declividade (Scree plot). O diagrama de de- 
clividade foi descrito anteriormente e e uma 
maneira util de estabelecer quantos fatores 
devem ser retidos numa analise. A solugao 
nao-rotacionada dos fatores e util para medir a 
melhoria na interpretagao devido a rotagao. Se 
a solugao rotacionada e um pouco melhor do 
que a solugao nao-rotacionada, e possrvel que 
um metodo nao apropriado (ou nao otimo) de 
rotagao tenha sido utilizado. 

A caixa de dialogo Extract (Extrair) for- 
nece opgoes relativas a retengao dos fatores. 
Voce tem a opgao de selecionar tanto fatores 
com autovalores maiores do que o valor que 
voce especificou quando reter um numero fixo 
de fatores. Para a opgao Eigenvalues over 
(Autovalores acima de), o padrao e a recomen- 
dagao de Kaiser de autovalores acima de 1, 
mas voce pode trocar isso para a recomenda- 
gao de Jolliffe de autovalores acima de 0,7 ou 
qualquer outro valor que quiser. Execute uma 


6 A razao e que o coeficiente de correlagao e insensfvel 
a varia 5 ao na dispersao dos dados, e a covariancia nao, 
produzindo, dessa maneira, uma estrutura de fatores 
mais bem definida (veja Tinsley e Tinsley, 1987). 
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analise preliminar com a opgao Eingenvalues 
over (Autovalores acima de) 1 marcada, sele- 
cione tambem a opgao do diagrama de declivi- 
dade e compare os resultados. Se o exame do 
diagrama de declividade e dos autovalores aci¬ 
ma de 1 levam voce a reter o mesmo niimero 
de fatores, continue com a analise. Se os dois 
criterios dao resultados diferentes, examine as 
comunalidades e decida voce mesmo em qual 
dos dois criterios acreditar. Se decidir usar o 
diagrama de declividade, refaca a analise espe- 
cificando o numero de fatores a extrair. O nu- 
mero de fatores a serem extrafdos e especifica- 
do selecionando Number of factors (Numero 
de fatores) e digitando o numero apropriado 
no espago fornecido (por exemplo, 4). 

15.5.2 Rotagao © 

Ja vimos que a interpretagao dos fatores 
pode ser melhorada atraves da rotagao. A ro¬ 
tagao maximiza a carga de cada variavel em 
um dos fatores extrafdos enquanto minimiza 
a carga nos demais. Esse processo torna mais 
claro quais variaveis se relacionam com cada 
fator. A rotagao e realizada atraves da mudanga 
dos valores absolutos das variaveis enquanto 
mantem constantes seus valores diferenciais. 
Clique em 1 (Rotagao) para acessar a 

caixa de dialogo semelhante a da Figura 15.8. 
Discuti as varias opgoes de rotagoes na Segao 
15.3.6.1, mas, para resumir, a escolha exata de 
rotagao dependera de se voce acha ou nao que 



Figura 15.8 Analise dos fatores: caixa de dia¬ 
logo da rotagao. 


os fatores subjacentes devem se relacionar. 
existem bases teoricas para achar que os fa¬ 

tores sao independentes (nao-relacionados), 
voce deve escolher uma das rotagoes ortogo- 
nais (recomendo a varimax). Entretanto, se a 

teoria sugere que seus fatores podem se corre- 

lacionar, uma das rotagoes oblfquas (oblimin 
direta ou promax) deve ser selecionada. Nesse 
exemplo, selecionei a varimax. 

para mostrar uma solugao rotacionada (Rota- 
ted solution) e um diagrama de carga (Loa¬ 
ding plot). A solugao rotacionada e mostra- 
da por padrao e e essencial para interpretar a 
analise rotacionada final. O grafico de carga 
fornecera uma representagao grafica de cada 
variavel tragada contra os fatores extrafdos ate 
um maximo de tres fatores (infelizmente, o 
SPSS nao pode produzir graficos de quatro ou 
cinco dimensoes!). Esse grafico e semelhante 
ao da Figura 15.1 e usa a carga de fatores de 
cada variavel para cada fator. Com dois fato¬ 
res esses graficos sao de facil interpretagao, e 
voce deve esperar ver um grupo de variaveis 
aglomeradas proximas do eixo x e um grupo 
diferente de variaveis aglomeradas em volta 
do eixo y. Se todas as variaveis estao aglo¬ 
meradas entre os eixos, a rotagao nao teve 
sucesso na maximizagao da carga de uma va¬ 
riavel sobre um unico fator. Com tres fatores 
esses graficos podem se tornar bem confusos 
e forgar consideravelmente o sistema visual! 
Entretanto, eles podem ainda ser uma maneira 
util para determinar as estruturas subjacentes 
dos dados. 

Uma opgao final e estabelecer a Maxi¬ 
mum Iterations for Convergence (Iteragoes 
maximas para convergencia), a qual especifica 
o numero de vezes que o computador ira pro- 
curar por uma solugao otima. Em muitas cir- 

cunstancias, o padrao de 25 e mais do que ade- 
quado para o SPSS encontrar uma solugao para 
um conjunto de dados. Entretanto, se voce ti- 

ver um conjunto grande de dados (como temos 
aqui), o computador podera ter dificuldade em 
encontrar uma solugao (especialmente para a 
'~ioi,k aiiBJIlkufjWjHfeit Jtvi 01 11 u til 111 frjSUSdcji oi i'3 
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15.5.3 Escores © 

A caixa de dialogo factor scores (esco- 
res dos fatores) (Figura 15.9) pode ser aces- 
sada clicando em s=ot»> (Escores) na caixa 
de dialogo principal. Essa opgao permite que 
voce salve os escores dos fatores (veja a Segao 
15.2.3) para cada pessoa no editor de dados. 
O SPSS cria uma nova coluna para cada fa- 
tor extrafdo e, entao, coloca o escore do fa- 
tor para cada pessoa dentro daquela coluna. 
Esses escores podem ser usados em analises 
posteriores ou simplesmente para identificar 
grupos de participantes que tem altos escores 
em fatores especfficos. Existem tres metodos 
para obter esses escores, todos eles foram des- 
critos nas Segoes 15.2.4 e 15.2.4.1. Se voce 
quer assegurar que os escores dos fatores nao 
sao correlacionados, selecione o metodo de 
Anderson-Rubin; se as correlagoes entre os 
escores dos fatores sao aceitaveis, escolha o 
metodo Regression (Regressao). 

Como uma opgao final, voce pode soli- 
citar ao SPSS que produza a matriz de coefi- 
ciente dos escores dos fatores. Essa e a matriz 
B descrita na Segao 15.2.4. Ela pode ser util 
se, por qualquer motivo, voce quiser construir 
equagoes dos fatores como as apresentadas 
em (15.5), porque ela fornece os valores de b 
para cada variavel. 

15.5.4 Opgoes © 

Esse conjunto de opgdes (Figura 15.10) 
pode ser obtido clicando em ° ct ° n * ■ (Opgoes) 
na caixa de dialogo principal. Dados perdidos 
sao um problema para a analise dos fatores, 



Figura 15.9 Analise dos fatores: caixa de dia¬ 
logo dos escores dos fatores. 



Figura 15.10 Analise dos fatores: caixa de dia¬ 
logo opgoes. 


assim como a maioria dos outros procedimen- 
tos, e o SPSS fornece uma escolha para ex- 
cluir casos ou estimar um valor para um caso. 
Tabachnick e Fidell (2001) tem um capftulo 
excelente na analise dos dados (Capftulo 4 
- veja tambem o nao tao excelente Capftulo 
3 desse livro). Baseado no conselho deles, 
voce deve considerar a distribuigao dos dados 
omissos. Se os dados omissos nao sao distri- 
bufdos normalmente ou o tamanho da amostra 
apos a exclusao e muito pequena, a estimativa 
e necessaria. O SPSS usa a media como uma 
estimativa Replace with mean (Substituir 
pela media). Esses procedimentos baixam o 
desvio padrao das variaveis e, desse modo, 
podem levar a resultados significativos que de 
outra forma poderiam ser nao-significativos. 
Portanto, se os dados omissos sao aleatorios, 
voce deve considerar a exclusao dos casos. O 
SPSS permite tanto a exclusao de casos em 
lista Exclude cases listwise, em que um par- 
ticipante com dados omissos e exclufdo em 
todas as variaveis, quanto a exclusao por pares 
Exclude cases pairwise, em que um partici- 
pante e exclufdo somente na variavel com da¬ 
dos omissos. Se voce excluir casos por pares, 
suas estimativas podem ir para qualquer lugar, 
portanto, talvez seja mais seguro excluir casos 
em lista, a nao ser que isso resulte numa perda 
massiva de dados. 

As duas opgoes finais dizem respeito a 
como os coeficientes sao mostrados. Por omis- 
sao, o SPSS ira listar as variaveis na ordem que 
elas entraram no editor de dados. Usualmente, 
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esse formato e mais conveniente. Entretanto, 
na interpretagao dos fatores, e algumas vezes 
util listar as variaveis por tamanho. Selecio- 
nando Sorted by size (Ordenando por tama¬ 
nho), o SPSS ira ordenar as variaveis pelas 
cargas dos fatores. Na verdade, ele faz essa 
ordenagao de uma forma bastante inteligente, 
de modo que todas as variaveis que estao al- 
tamente carregadas no mesmo fator sao apre- 
sentadas juntas. A segunda opgao e Supress 
absolute values less than (Eliminar valores 
absolutos menores que) um valor especificado 
(por omissao, 0,1). Essa opgao assegura que 
cargas dos fatores no intervalo de ±0,1 nao 
serao mostradas na safda. Novamente, essa op¬ 
gao e util para ajudar na interpretagao. O valor 
por omissao provavelmente e adequado, mas 
para a sua primeira analise, recomendo troca- 
-lo por 0,4 (para fms de interpretagao) ou por 
um valor que reflita o valor esperado de uma 
carga dos fatores significativa considerando o 
tamanho da amostra (veja a Segao 15.3.6.2). 
Isso tornara a interpretagao mais simples. Se 
quiser, voce pode executar novamente a ana¬ 
lise e ajustar esse valor mais baixo para ver se 
nao esqueceu nada (como uma carga de 0,39). 
Para esse exemplo, ajuste o valor em 0,4. 

15.6 INTERPRETANDO SAIDAS DO 
SPSS© 

Selecione as mesmas opgoes que selecio- 
nei e execute a analise dos fatores com a ro- 
tagao ortogonal. Feito isso, selecione a opgao 
Direct Oblimin (Oblimin direta) conforme 

fiiMliilW&liiMllllIM 

com cxcecao daquela que usou a rotacao orto- 

Para economizar espaco nesta segao, dei- 
xei as opgoes por omissao do SPSS, assim, cada 
variavel e referida somente pelo seu nome no 
editor de dados (por exemplo, Q12). Na safda 
que voce ira obter, voce vera que o SPSS usa 
como rotulo de valor (a propria pergunta) em 
todas as safdas. Quando usar as safdas neste ca- 
pftulo, lembre que Q1 representa a pergunta 1, 
Q2 representa a pergunta 2 e Q17 representa a 


pergunta 17. Voltando a Figura 15.4 e combi- 
nando o numero da pergunta com o nome da 
variavel, voce podera identificar cada pergunta. 

15.6.1 Analise preliminar © 

A primeira parte da safda se refere a ana¬ 
lise dos dados, teste das hipoteses e adequagao 
da amostra. Voce encontrara muitas tabelas 
grandes (ou matrizes) que informam aspectos 
interessantes sobre nossos dados. Se voce sele- 
cionou a opgao Univariate descriptives (Des- 
critivas univariadas) como na Figura 15.6, a 
primeira tabela contera estatfsticas descritivas 
para cada variavel (a media, o desvio padrao 
e o numero de casos). Essa tabela nao esta in- 
clufda aqui, mas voce deve ser capaz de inter- 
preta-la. A tabela tambem inclui o numero de 
casos omissos; esse resumo e uma maneira util 
para determinar o total de dados omissos. 

A Safda 15.1 do SPSS mostra a matriz-R 
(ou matriz de correlagao) 7 produzida usando 
as opgoes Coefficients and Significance le¬ 
vels (Coeficientes e Nfveis de significancia) 
como na Figura 15.6. A parte superior da 
tabela apresenta o coeficiente correlagao de 
Pearson entre todos os pares de perguntas, en- 
quanto a parte inferior mostra a significancia 
unilateral desses coeficientes. Voce deve estar 
confortavel com a ideia de que para fazer uma 
analise de fatores, precisamos ter variaveis 

que se correlacionem muito bem, mas nao 

perfeitamente. Tambem, quaisquer variaveis 
que nao se correlacionem devem ser elimi- 

nadas. Portanto, podemos usar essa matriz 
de correlagoes para checar o padrao dos re- 
lacionamentos. A maneira mais facil de fazer 
isso e examinar cuidadosamente os valores de 
significancia e procurar por qualquer variavel 
para qual a maioria dos valores seja maior do 
que 0,05. Depois, examine os coeficientes de 
correlagao e procure por qualquer um maior 
do que 0,9. Se algum for encontrado, voce 
deve ficar atento ao problema da singulari- 


7 Para ganhar espaco, retirei varias colunas de dados das 
tabelas grandes; somente dados para as primeiras e as 
ultimas cinco perguntas do questionario estao incluidos. 
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Saida 15.1 do SPSS 


Correlation Matrix a (Matriz de Correlagoes) 



Q01 

Q02 

Q03 

004 

Q05 

019 

Q20 

021 

Q22 

023 

Correlation Q1 

1.000 

-0.099 

-0.337 

0.436 

0.402 

-0.189 

0.214 

0.329 

-0.104 

-0.004 

(Correlacao) Q2 

-0.099 

1.000 

0.318 

-0.112 

-0.119 

0.203 

-0.202 

-0.205 

0.231 

0.100 

Q3 

-0.337 

0.318 

1.000 

-0.380 

-0.310 

0.342 

-0.325 

-0.417 

0.204 

0.150 

Q4 

0.436 

-0.112 

-0.380 

1.000 

0.401 

-0.186 

0.243 

0.410 

-0.098 

-0.034 

Q5 

0.402 

-0.119 

-0.310 

0.401 

1.000 

-165 

0.200 

0.335 

-0.133 

-0.042 

Q6 

0.217 

-0.074 

-0.227 

0.278 

0.257 

-0.167 

0.101 

0.272 

-0.165 

-0.069 

Q7 

0.305 

-0.159 

-0.382 

0.409 

0.339 

-0.269 

0.221 

0.483 

-0.168 

-0.070 

Q8 

0.331 

-0.050 

-0.259 

0.349 

0.269 

-0.159 

0.175 

0.296 

-0.079 

-0.050 

Q9 

0:92 

0.315 

0.300 

-0.125 

-0.096 

0.249 

-0.159 

-0.136 

0.257 

0.171 

Q10 

0.214 

-0.084 

-0.193 

0.216 

0.258 

-0.127 

0.084 

0.193 

-0.131 

-0.062 

Q11 

0.357 

-0.144 

-0.351 

0.369 

0.298 

-0.200 

0.255 

0.346 

-0.162 

-0.086 

Q12 

0.345 

-0.195 

-0.410 

0.442 

0.347 

-0.267 

0.298 

0.441 

-0.167 

-0.046 

Q13 

0.355 

-0.143 

-0.318 

0.344 

0.302 

-0.227 

0.204 

0.374 

-0.195 

-0.053 

Q14 

0.338 

-0.165 

-0.371 

0.351 

0.315 

-0.254 

0.226 

0.399 

-0.170 

-0.048 

Q15 

0.246 

-0.165 

-0.312 

0.334 

0.261 

-0.210 

0.206 

0.300 

-0.168 

-0.062 

Q16 

0.499 

-0.168 

-0.419 

0.416 

0.395 

-0.267 

0.265 

0.421 

-0.156 

-0.082 

Q17 

0.371 

-0.087 

-0.327 

0.383 

0.310 

-0.163 

0.205 

0.363 

-0.126 

-0.092 

Q18 

0.347 

-0.164 

-0.375 

0.382 

0.322 

-0.257 

0.235 

0.430 

-0.160 

-0.080 

Q19 

-0.189 

0.203 

0.342 

-0.186 

-0.165 

1.000 

-0.249 

-0.275 

0.234 

0.122 

Q20 

0.214 

-0.202 

-0.325 

0.243 

0.200 

-0.249 

1.000 

0.468 

-0.100 

-0.035 

Q21 

0.329 

-0.205 

-0.417 

0.410 

0.335 

-0.275 

0.468 

1.000 

-0.129 

-0.068 

Q22 

-0.104 

0.231 

0.204 

-0.098 

-0.133 

0.234 

-0.100 

-0.129 

1.000 

0.230 

Q23 

-0.004 

0.100 

0.150 

-0.034 

-0.042 

0.122 

-0.035 

-0.068 

0.230 

1.000 

Sig. (1-tailed) Q1 


0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

«IS) 

(Sig. Unilateral) Q2 

0.000 


0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

Q3 

0.000 

0.000 


0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

Q4 

0.000 

0.000 

0.000 


0.000 

0.000 

0.000 

0.000 

0.000 

0.043 

Q5 

0.000 

0.000 

0.000 

0.000 


0.000 

0.000 

0.000 

0.000 

0.017 

Q6 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

Q7 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

Q8 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.005 

Q9 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

Q10 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.001 

Q11 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

Q12 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.009 

Q13 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.004 

Q14 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.007 

Q15 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.001 

Q16 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

Q17 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

Q18 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

Q19 

0.000 

0.000 

0.000 

0.000 

0.000 


0.000 

0.000 

0.000 

0.000 

Q20 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 


0.000 

0.000 

0.039 

Q21 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 


0.000 

0.000 

Q22 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 


0.000 

Q23 

0.410 

0.000 

0.000 

0.043 

0.017 

0.000 

0.039 

0.000 

0.000 



a Determinant = 5.271 E-04 (Determinante = 0,0005271) 


matriz de correlagao e, se necessario, elimi- 

ne uma das duas variaveis que podem estar 
causando o problema. O determinante esta 

listado na parte de baixo da matriz (pisque e 

5,271E-04 (que e 0,0005271), que e maior do 


(veja a Se 9 ao 15.5) 8 Portanto, podemos estar 

confiantes de que a multicolinearidade nao 


Rigorosamente falando, o determinante ou a matriz de 
correla^o deve ser checada somente na analise dos fa- 
tores: na analise pura dos componentes principais ela 
nao e relevante. 
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sera um problema para esses dados. Resu- 
mindo, todas as questoes no QAS se correla- 
cionam muito bem com todas as outras (isso 

ocorre em parte devido ao grande tamanho da 
amostra) e nenhum dos coeficientes de corre¬ 

late e particularmente grande; portanto, nao 
ha necessidade de considerar a eliminate de 

A Saida 15.2 do SPSS mostra o inverso da 
matriz de correlate (R 1 ), que e usada em va- 
rios calculos (incluindo os escores dos fatores 
- veja a Se^ao 15.2.4). Essa matriz e produzi- 
da usando a opgao Inverse (Inverso), Figura 
15.6, mas ela e somente util se voce quer ter 
algumas percepcoes sobre como os calculos 
sao feitos na analise de fatores. A maioria de 
nos tern coisas mais interessantes a fazer do 
que saber como realizar os calculos na analise 
de fatores e o uso dessa matriz e mmimo - as- 
sim, ignore-a! 

A Saida 15.3 do SPSS mostra varias par¬ 
tes importantes da safda: o KMO, o teste de 
esfericidade de Bartlett e as matrizes de co- 
variancias e anti-imagem das correlates 
(note que essas matrizes foram editadas para 


conter somente a primeira e as ultimas cinco 
variaveis). As matrizes de covariancias e a 
anti-imagem das correlates fornecem infor¬ 
mates semelhantes (lembre o relacionamen- 
to entre covariancia e correlate); somente a 
matriz de anti-imagem das correlates precisa 
ser estudada em detalhes porque ela e a mais 
informativa. Essas tabelas sao obtidas utili- 
zando op^oes KMO and Bartlett’s test of 
sphericity (KMO e o teste de esfericidade de 
Bartlett) e Anti-image (Anti-imagem), como 
na Figura 15.6. 

Aprendemos sobre a estatistica KMO na 
JtlUp' IS®!)! | vimos que .JSgsisei? 
comenda um mmimo de 0,5, e que os valores 
entre 0,5 e 0,7 sao medfocres, valores entre 0,7 
e 0,8 sao bons, valores entre 0,8 e 0,9 sao oti- 
mos e valores acima de 0,9 sao excelentes (veja 

Hutcheson e Sofroniou, 1999, p. 224-225, para 

sim, devemos estar confiantes de que a analise 
(dos fatores e apropriada para esses dados. 

Mencionei que o KMO pode ser calcula- 
do para uma ou mais variaveis. Os valores do 


Saida 15.2 do SPSS 


Inverse of Correlation Matrix* (Inversa da Matriz de Correlagoes) 



Q01 

002 

003 

Q04 

005 

019 

Q20 

021 

Q22 

Q23 

Q1 

1.595 

-0.028 

0.087 

-0.268 

-0.233 

0.017 

-0.024 

0.011 

0.002 

-0.078 

Q2 

-0.028 

1.232 

-0.224 

-0.057 

0.013 

-0.037 

0.076 

0.062 

-0.148 

-0.003 

Q3 

0.087 

-0.224 

1.661 

0.138 

0.057 

-0.175 

0.118 

0.122 

-0.009 

-0.103 

Q4 

-0.268 

-0.057 

0.138 

1.626 

-0.203 

-0.049 

-0.006 

-0.149 

-0.045 

-0.023 

Q5 

-0.233 

0.013 

0.057 

-0.203 

1.410 

-0.024 

-0.016 

-0.074 

0.045 

-0.006 

Q6 

0.034 

-0.078 

-0.072 

-0.011 

-0.055 

-0.023 

0.080 

0.069 

0.058 

0.025 

Q7 

0.039 

0.025 

0.127 

-0.152 

-0.072 

0.105 

0.077 

-0.386 

0.019 

-0.012 

Q8 

-0.087 

-0.051 

-0.013 

-0.134 

-0.045 

0.074 

0.034 

-0.039 

-0.035 

0.003 

Q9 

-0.023 

-0.242 

-0.208 

0.043 

-0.027 

-0.141 

0.050 

-0.047 

-0.156 

- 0.110 

Q10 

-0.017 

-0.015 

-0.023 

0.009 

-0.124 

-0.012 

0.056 

0.026 

0.023 

0.017 

Q11 

-0.075 

0.061 

0.121 

-0.041 

0.000 

-0.010 

-0.140 

-0.009 

0.055 

0.015 

Q12 

-0.011 

0.046 

0.147 

-0.259 

-0.091 

0.060 

-0.100 

-0.141 

0.026 

-0.038 

Q13 

-0.145 

-0.011 

-0.055 

0.040 

0.007 

0.014 

0.028 

-0.061 

0.077 

-0.042 

Q14 

-0.064 

0.033 

0.115 

-0.007 

-0.040 

0.063 

0.002 

-0.110 

0.041 

-0.034 

Q15 

0.138 

0.050 

0.013 

-0.098 

0.021 

0.013 

-0.054 

0.058 

0.034 

-0.030 

Q16 

-0.454 

-0.017 

0.142 

-0.063 

-0.155 

0.071 

-0.008 

-0.158 

-0.005 

0.033 

Q17 

-0.084 

-0.045 

0.063 

-0.064 

-0.030 

-0.074 

0.025 

-0.077 

0.015 

0.080 

Q18 

-0.041 

0.028 

0.070 

-0.044 

0.004 

0.047 

-0.004 

-0.136 

-0.037 

0.033 

Q19 

0.017 

-0.037 

-0.175 

-0.049 

-0.024 

1.264 

0.120 

0.048 

-0.141 

-0.045 

Q20 

-0.024 

0.076 

0.118 

-0.006 

-0.016 

0.120 

1.370 

-0.511 

-0.014 

-0.034 

Q21 

0.011 

0.062 

0.122 

-0.149 

-0.074 

0.048 

-0.511 

1.830 

-0.036 

0.018 

Q22 

0.002 

-0.148 

-0.009 

-0.045 

0.045 

-0.141 

-0.014 

-0.036 

1.200 

-0.202 

Q23 

-0.078 

-0.003 

-0.103 

-0.023 

-0.006 

-0.045 

-0.034 

0.018 

-0.202 

1.094 
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Sai'da 15.3 do SPSS 

KMO and Bartlett's Test (KMO e teste de Bartllet) 


Kaiser-Meyer-Olkin Measure of Sampling Adequacy (Adequaqao da Amostra de 

0.930 

Kayser-Meyer-Olkin) 


Bartlett's Test of Spericity (Teste de Esferi- Approx. Chi-Square (Qui-quadrado 

19334.492 

cidade de Bartlett) aproximado) 


Df( gl) 

253 

Sig. (Sig.) 

0.000 


Anti-Image Matrices (Matrizes Anti-lmagem) 


Anti-Image Correlation (Correlagoes Anti-lmagem) 



001 

002 

003 

004 

005 

019 

020 

Q21 

022 

Q23 

Q1 

0.930 

-2.00E-02 

5.320E-02 

-0.167 

-0.156 

1.231 E-02 

-1.61 E-02 

6.436E-03 

1.459E-03 

-5.92E-02 

Q2 

-2.00E-02 

0.875 

-0.157 

-4.05E-02 

1.019E-02 

-2.93E-02 

5.877E-02 

4.139E-02 

-0.121 

-2.39E-03 

Q3 

5.320E-02 

-0.157 

0.951 

8.381 E-02 

3.725E-02 

-0.121 

7.790E-02 

6.983E-02 

-6.57E-03 

-7.63E-02 

Q4 

-0.167 

-4.05E-02 

8.381 E-02 

0.955 

-0.134 

-3.42 E-03 

^1.07 E-03 

-8.64E-02 

-3.25E-02 

-1.71 E-02 

Q5 

-0.156 

1.019E-02 

3.725E-02 

-0.134 

0.960 

-1.77E-02 

-1.14E-02 

-4.59E-02 

3.455E-02 

-4.75E-03 

Q6 

2.016E-02 

-5.33E-02 

-4.23E-02 

-6.77E-03 

-3.52E-02 

1.53E-02 

5.144E-02 

3.867E-02 

3.984E-02 

1.846E-02 

Q7 

2.264E-02 

1.648E-02 

7.159E-02 

-8.66E-02 

-4.43E-02 

6.802 E-02 

4.796E-02 

-0.208 

1.278E-02 

-8.07E-03 

Q8 

-4.91 E-02 

-3.28E-02 

-7.28E-03 

-7.49E-02 

-2.72E-02 

4.696E-02 

2.094E-02 

-2.05E-02 

-2.28E-02 

2.202E-03 

Q9 

-1.64E-02 

-0.193 

-0.142 

2.960E-02 

-1.98E-02 

-0.111 

3.803E-02 

-3.06E-02 

-0.126 

-9.25E-02 

Q10 

-1.22E-02 

-1.21 E-02 

-1.62E-02 

6.031 E-03 

-9.32E-02 

-9.16E-03 

4.272E-02 

1.699 E-02 

1.867E-02 

1.462E-02 

Q11 

-4.07E-02 

3.757E-02 

6.429E-02 

-2.22E-02 

-3.27E-05 

-5.81 E-03 

-8.18E-03 

-4.58E-03 

3.425E-02 

9.600E-03 

Q12 

-6.62E-03 

3.129 E-02 

8.667E-02 

-0.154 

-5.83E-02 

4.030E-02 

-6.47E-02 

-7.93E-02 

1.802E-02 

-2.79E-02 

Q13 

-8.51 E-02 

-7.60E-03 

-3.16E-02 

2.303E-02 

4.238E-03 

8.994E-03 

1.785E-02 

-3.33E-02 

5.233E-02 

-2.99E-02 

Q14 

-3.98E-02 

2.313E-02 

6.946E-02 

-4.26E-03 

-2.63E-02 

4.399E-02 

1.124E-03 

-6.32E-02 

2.896E-02 

-2.56E-02 

Q15 

8.860E-02 

3.680E-02 

8.159E-03 

-6.21 E-02 

1.413E-02 

9.384E-03 

-3.74E-02 

3.483E-02 

2.485E-02 

-2.36E-02 

Q16 

-0.264 

-1.14E-02 

8.057E-02 

-3.62E-02 

-9.57E-02 

4.659E-02 

-5.30E-03 

-8.54E-02 

-3.26E-03 

2.298E-02 

Q17 

-4.74E-02 

-2.87E-02 

3.467E-02 

-3.55E-02 

-1.80E-02 

-4.68E-02 

1.004E-02 

-4.06E-02 

1.004E-02 

5.457E-02 

Q18 

-2.31 E-02 

1.825E-02 

3.880E-02 

-2.45 E-02 

2.489E-03 

2.980E-02 

-2.54E-03 

-7.17 E-02 

-2.40E-02 

2.257E-02 

Q19 

1.23 IE-02 

-2.93E-02 

-0.121 

-3.42E-02 

-1.77E-02 

0.941 

9.081 E-02 

3.145E-02 

-0.115 

-3.84E-02 

Q20 

-1.61 E-02 

5.877E-02 

7.790E-02 

-4.07E-03 

-1.14E-02 

9.081 E-02 

0.889 

-0.323 

-1.12E-02 

-2.81 E-02 

Q21 

6.436E-03 

4.139E-02 

6.983-02 

-8.64E-02 

-4.59E-02 

3.145E-02 

-0.323 

0.929 

-2.41 E-02 

1.275E-02 

Q22 

1.459E-03 

-0.121 

-6.57E-03 

-3.25E-02 

3.455E-02 

-0.115 

-1.12E-02 

-2.41 E-02 

0.078 

-0.176 

Q23 

-5.92E-02 

-2.39E-03 

-7.63E-02 

-1.71 E-02 

-4.75E-03 

-3.84E-02 

-2.81 E-02 

1.275E-02 

-0.176 

0.766 


KMO para variaveis individuals sao apresen- 
tados na diagonal da matriz anti-imagem e das 
correlates (marquei os valores em negrito). 
Esses valores fazem da matriz anti-imagem e 
das correlates unia parte extremamente im- 
portante da safda (embora a matriz anti-imagem 
das covariancias possa ser ignorada). Alem de 
verificar todas as estatfsticas KMO, tambem e 
importante examinar os elementos diagonals 
da matriz anti-imagem das correlates: o va¬ 
lor deve estar acima de um minimo de 0,5 para 
todas as variaveis (e preferencialmente mais 
alto). Para esses dados, todos os valores estao 
bem acima de 0,5, o que e uma otima noticia! 
Se voce encontrar qualquer variavel com valor 
abaixo de 0,5, deve considerar excluf-la da ana- 
lise (ou executar a analise com e sem aquela 
variavel e ver a diferenga). A remogao de uma 


variavel afeta as estatisticas do KMO, assim, 
se voce realmente remover a variavel, tenha 
certeza de re-examinar a nova matriz anti-ima¬ 
gem das correlagbes. Para o restante da matriz 
anti-imagem das correlagbes, os elementos fora 
da diagonal representam as correlagbes parciais 
entre as variaveis. Para uma boa analise dos fa- 
tores, queremos que essas correlagbes sejam 
bem pequenas (quanto menor, melhor). Assim, 
numa checagem final, voce apenas verifica se 
os elementos fora da diagonal sao pequenos 
(eles devem ser para esses dados). 

As medidas de Bartlett testam a hipotese 
nula de que a matriz de correlagbes original e 
uma matriz identidade. Para a analise de fato- 
res funcionar, precisamos de relacionamentos 
entre variaveis, e se a matriz-R e uma matriz 
identidade, todos os coeficientes de correla- 
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Dica da Samanta Ferrinho 


A 



V. 


• Examine cuidadosamente a Matriz de Correlagdes: procure variaveis que nao 
se correlacionam com quaisquer outras variaveis ou se correlacionem alta- 

mente (r = 0,9) com uma ou mais variaveis. Na analise de fatores, cheque se 
o determinante dessa matriz e maior do que 0,00001; se for, a multicolineari- 

• N a ta be I a rot u I ad a de K M O e Teste de Bartlett, a estatistica deKMOdeve se r 
maior do que 0,5 no minimo; se ela nao for, colete mais dados. O teste de Bar- 
iBHBSEH£aUfiHS&BBH3BUBSH3!Kn3l%d@LSip<3,eVe ser menor 
do que 0,05). Voce tambem pode verificar a estatistica de KMO para variaveis 
individuals olhando para a diagonal das Matrizes de Autoimagem: novamen- 
te, esses valores devem estar acima de 0,5 (isso e util para identificar variaveis 
problematicas se todo o KMO for insatisfatorio). 


gao serao zero. Portanto, queremos que esse 
teste seja significative/ (isto e, tenha um valor 
de significance menor do que 0,05). Um teste 
significativo nos informa que a matriz-R nao 
e uma matriz identidade; portanto, existent re- 
lacionamentos entre variaveis que esperamos 
incluir na analise. Para esses dados, o teste de 
Bartlett e altamente significativo (p < 0,001) 
e, portanto, a analise dos fatores e apropriada. 

15.6.2 Extragao de fatores © 

A primeira parte do processo de extracao 
do fator e determinar os componentes lineares 
dentro de um conjunto de dados (os autove- 
tores) calculando os autovalores da matriz-R 
(veja a Se^ao 15.3.4). Sabemos que ha tantos 
componentes (autovetores) na matriz-R quan¬ 
to variaveis, mas a maioria nao tera impor¬ 
tancia. Para determinar a importancia de um 
vetor particular, olhamos para a magnitude do 
autovalor associado. Podemos, entao, aplicar 
um criterio para determinar quais fatores de- 
vemos reter e quais devemos descartar. Por 
omissao, o SPSS usa o criterio de fatores reti- 
dos de Kaiser com autovalores maiores do que 
1 (veja a Figura 15.7). 

A Saida 15.4 do SPSS lista os autovalo¬ 
res associados com cada componente linear 
(fator) antes da extracao, depois da extracao e 
depois da rotacao. Antes da extra 9 ao, o SPSS 
identificou 23 componentes lineares dentro 
do conjunto de dados (sabemos que deveria 


haver o mesmo numero de autovetores que de 
variaveis, assim, havera tantos fatores quanto 
variaveis - veja a Se^ao 15.3.4). Os autovalo¬ 
res associados com cada fator representam a 
variancia explicada por aquele componente li¬ 
near particular, e o SPSS tambem mostra o au¬ 
tovalor em termos de percentagem da variancia 
explicada (assim, o fator 1 explica 31,696% da 
variancia total). Deve estar claro que os pri- 
meiros fatores explicam quantias relativamente 
grandes das variancias (especialmente o fator 
1), enquanto os fatores subsequentes explicam 
somente pequenas quantias das variancias. O 
SPSS, entao, extrai todos os fatores com au¬ 
tovalores maiores do que 1, o que nos deixa 
com quatro fatores. Os autovalores associados 
com esses fatores sao, novamente, exibidos (e 
a percentagem da variancia explicada) na co- 
luna Somas Extraidas das Cargas ao Quadrado 
(Extraction Sums Of Squared Loadings). Os 
valores nessa parte da tabela sao os mesmos de 
antes da extracao, exceto que os valores para 
os fatores descartados sao ignorados (por isso 
a tabela esta em branco depois do quarto fator). 
Na parte final da tabela (denominada Rotacao 
das Somas das Cargas ao Quadrado (Rotation 
Sums of Squared Loadings)), os autovalores 
dos fatores apos rotacao sao exibidos. A rota- 
(jao tern o efeito de otimizar a estrutura do fator 
e uma consequencia para esses dados e que a 
relativa importancia dos quatro fatores e equa- 
lizada. Antes da rotacao, o fator 1 e responsavel 
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Saida 15.4 do SPSS 


Total Variance Explained (Variancia Total Explicada) 



Initial Eigenvalues 
(Autovalores Iniciais) 

Extraction Sums of Squared 
Loadings (Somas Extraidas 
das Cargas ao Quadrado) 

Rotation Sums of Squared 
Loadings (Somas Rotacionadas 
das Cargas ao Quadrado) 



% of 



% of 



%of 




Variance 

Cumulative 


Variance 

Cumulative 


Variance 

Cumulative 

Component 

Total 

(% da 

% (% 

Total 

(% da 

% (% 

Total 

(% da 

% (% 

(Componente) 

(Total) 

Variancia) 

Acumulada) 

(Total) 

Variancia) 

Acumulada) 

(Total) 

Variancia) 

Acumulada) 

i 

7.290 

31.696 

31.696 

7.290 

31.696 

31.696 

3.730 

16.219 

16.219 

2 

1.739 

7.560 

39.256 

1.739 

7.560 

39.256 

3.340 

14.523 

30.742 

3 

1.317 

5.725 

44.981 

1.317 

5.725 

44.981 

2.553 

11.099 

41.842 

4 

1.227 

5.336 

50.317 

1.227 

5.336 

50.317 

1.949 

8.475 

50.317 

5 

0.988 

4.295 

54.612 







6 

0.895 

3.893 

58.504 







7 

0.806 

3.502 

62.007 







8 

0.783 

3.404 

65.410 







9 

0.751 

3.265 

68.676 







10 

0.717 

3.117 

71.793 







11 

0.684 

2.972 

74.765 







12 

0.670 

2.911 

77.676 







13 

0.612 

2.661 

80.337 







14 

0.578 

2.512 

82.849 







15 

0.549 

2.388 

85.236 







16 

0.523 

2.275 

87.511 







17 

0.508 

2.210 

89.721 







18 

0.456 

1.982 

91.704 







19 

0.424 

1.843 

93.546 







20 

0.408 

1.773 

95.319 







21 

0.379 

1.650 

96.969 







22 

0.364 

1.583 

98.552 







23 

0.333 

1.448 

100.000 








Metodo de Extragao: Analise dos Componentes Principais. 


por consideravelmente mais variancias do que 
as tres remanescentes (31,696% comparado 
com 7,560%, 5,725% e 5,336%); entretanto, 
depois da extragao e responsavel por somente 
16,219% da variancia (comparada a 14,523%, 
11,099% e 8,475%, respectivamente). 

A Saida do SPSS 15.5 mostra uma tabela 
das comunalidades antes e depois da extragao. 
Lembre que a comunalidade e a proporgao 
da variancia comum dentro da variavel (veja 
a Segao 15.3.1). A analise dos componentes 
principais trabalha com a suposigao inicial de 
que toda a variancia e comum; portanto, an¬ 
tes da extragao as comunalidades sao todas 1 
(veja a coluna Inicial (Initial)). De fato, todas 
as variancias associadas com uma variavel sao 
supostamente uma variancia comum. Depois 
que os fatores foram extraldos, temos uma 
ideia melhor de quanta variancia e, na reali¬ 


dade, comum. As comunalidades na coluna 
rotulada de Extragao ( Extraction ) refletem 
essa variancia comum. Assim, por exemplo, 
podemos dizer que 43,5% da variancia asso- 
ciada a pergunta 1 e uma variancia comum ou 
compartilhada. Outra maneira de analisar es- 
sas comunalidades e em termos da proporgao 
da variancia explicada pelos fatores adjacen- 
tes. Antes da extragao existem tantos fatores 
quanto variaveis, assim, toda a variancia e ex¬ 
plicada pelos fatores e todas as comunalidades 
sao 1. Entretanto, depois da extragao alguns 
dos fatores sao descartados e alguma informa- 
gao e perdida. Os fatores retidos nao podem 
explicar toda a variancia presente nos dados, 
mas podem explicar uma parte. A quantidade 
de variancia em cada variavel que pode ser 
explicada pelos fatores retidos e representada 
pelas comunalidades depois da extragao. 
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A Saida 15.5 do SPSS tambem mostra a 
matriz de componentes antes da rotagao. Essa 
matriz contem as cargas de cada variavel em 
cada fator. Por omissao, o SPSS exibe todas 
as cargas; entretanto, solicitamos que todas as 
cargas menores do que 0,4 sejam eliminadas 
da safda (veja a Figura 15.10), assim, existem 
espagos em branco para muitas das cargas. 
Essa matriz nao e importante para interpre- 
tacao, mas e interessante notar que antes da 
rotagao a maioria das variaveis ja estava com 
altas cargas no primeiro fator (isso porque 
esse fator e responsavel pela maior parte da 
variancia na Safda 15.4 do SPSS). 

Nesse estagio, o SPSS extraiu quatro fato- 
res. A analise de fatores e uma ferramenta de 
exploragao, portanto, ela deveria guiar o pes- 
quisador na tomada de varias decisoes: voce 
nao deveria deixar o computador faze-las. 
Uma decisao importante e o numero de fato¬ 
res a serem extrafdos. Na Segao 15.3.5, vimos 


varios criterios para determinar a importancia 
dos fatores. Pelo criterio de Kaiser, deverfamos 
extrair quatro fatores e isso e o que o SPSS 
fez. Entretanto, esse criterio e preciso quando 
existem menos do que 30 variaveis e as comu- 
nalidades apos a extragao sao maiores do que 
0,7, ou quando o tamanho da amostra excede 
a 250 e a media da comunalidade e maior do 
que 0,6. As comunalidades sao exibidas na 
Safda 15.5 do SPSS e nenhuma excede a 0,7. 
A media das comunalidades pode ser encon- 
trada somando-as e dividindo-as pelo numero 
de comunalidades (11,573/23 = 0,503). Assim, 
em ambos os casos a regra de Kaiser pode nao 
ser precisa. Entretanto, voce deve considerar a 
amostra enorme que temos porque a pesquisa 
no criterio de Kaiser recomenda amostras bem 
menores. Pelo criterio de Jolliffe (reter fatores 
com autovalores maiores do que 0,7), devemos 
reter 10 fatores (veja a Safda 15.4 do SPSS), 
mas esse criterio nao e mais recomendavel que 


Safda 15.5 do SPSS 
Communalities 


(Comunalidades) 



Initial 

(Inicial) 

Extraction 

(Extragao) 

Q1 

1.000 

0.435 

Q2 

1.000 

0.414 

Q3 

1.000 

0.530 

Q4 

1.000 

0.469 

Q5 

1.000 

0.343 

Q6 

1.000 

0.654 

Q7 

1.000 

0.545 

Q8 

1.000 

0.739 

Q9 

1.000 

0.484 

Q10 

1.000 

0.335 

Q11 

1.000 

0.690 

Q12 

1.000 

0.513 

Q13 

1.000 

0.536 

Q14 

1.000 

0.488 

Q15 

1.000 

0.378 

Q16 

1.000 

0.487 

Q17 

1.000 

0.683 

Q18 

1.000 

0.597 

Q19 

1.000 

0.343 

Q20 

1.000 

0.484 

Q21 

1.000 

0.550 

Q22 

1.000 

0.464 

Q23 

1.000 

0.412 


Component Matrix s 
(Matriz dos componentes) 



Component (Componente) 

1 

2 

3 

4 

Q18 

0.701 




Q07 

0.685 




Q16 

0.679 




Q13 

0.673 




Q12 

0.669 




Q21 

0.658 




Q14 

0.656 




Q11 

0.652 



-0.400 

Q17 

0.643 




Q04 

0.634 




Q03 

-0.629 




Q15 

0.593 




Q01 

0.586 




Q05 

0.556 




Q08 

0.549 

0.401 


-0.417 

Q10 

0.437 




Q20 

0.436 


-0.404 


Q19 

-0.427 




Q09 


0.627 



Q02 


0.548 



Q22 


0.465 



Q06 

0.562 


0.571 


Q23 




0.507 


Metodo de Extragao: Componen- Metodo de Extragao: Analise dos Componentes 

tes Principais. Principais. 

a 4 componentes extraidos. 
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o de Kaiser. Como um guia final, podemos 
usar o diagrama de declividade que pedimos 
ao SPSS produzir usando a opcao da Figura 
15.7. O diagrama de declividade e mostrado na 
Saida 15.6 do SPSS com um raio indicando o 
ponto de inflexao na curva. Essa curva e dificil 
de interpretar porque ela comega a ter uma cau- 
da apos tres fatores, mas ha outra queda apos 
o quarto fator antes que um plato estavel seja 


alcancado. Portanto, podemos, provavelmente, 
justificar reter dois ou quatro fatores. Dado a 
amostra grande, e provavelmente seguro acei- 
tar o criterio de Kaiser; entretanto, seria acon- 
selhavel executar novamente a analise especifi- 
cando que o SPSS extraia somente dois fatores 
(veja a Figura 15.7) e comparar os resultados. 

A Saida 15.7 do SPSS mostra uma versao 
editada da matriz de correlagoes reproduzida 


Saida 15.6 do SPSS 


Diagrama de Declividade 



r 


Dicas da Samantha Ferrinho: Extragao dos Fatores 





V. 


• Para decidir quantos fatores extrair, olhe para a tabela Communalities (Comu- 
nalidades) e a coluna Extraction (Extragao). Se todos esses valores sao 0,7 ou 

para a extragao dos fatores e boa (o criterio de Kaiser da retengao dos fatores 
com autovalores maiores do que 1). Do mesmo modo, se o seu tamanho da 

omissao e otima. Alternativamente, com 200 ou mais participantes o diagra- 

• Verifique a parte de baixo da tabela Reproduced Correlations (Correlagoes Re- 
produzidas) para a percentagem dos "residuos nao redundantes com valores 
absolutos > 0,05". Essas percentagens devem ser menores do que 50%, e 
quanto menores ela forem, melhor. 















Reproduced Correlations (Correlates reproduzidas) 
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que foi solicitada usando a opgao da Figura 
15.6. A parte mais alta dessa matriz (rotulada de 
Reproduced Correlations (Correlates Repro- 
duzidas)) contem os coeficientes de correlates 
entre todas as perguntas baseadas no modelo de 
fatores. A diagonal dessa matriz contem as co- 
munalidades apos a extragao de cada variavel 
(coloquei esses valores em negrito; voce pode 
checar os valores com a Saida 15.5 do SPSS). 

As correlates na matriz reproduzida dife- 
rem daquelas da matriz-R porque elas provem 
do modelo em vez de dos dados observados. Se 
o modelo fosse um ajuste perfeito dos dados, 
esperarfamos que os coeficientes de correlagao 
reproduzidos fossem os mesmos que os coefi¬ 
cientes de correlate originais. Portanto, para 
verificar o ajuste do modelo, podemos olhar as 
diferengas entre as correlagoes observadas e as 
correlagoes baseadas no modelo. Por exemplo, 

e de -0,099 (tirada da Saida 15.1 do SPSS). A 
correlagao baseada no modelo e de —0,112, 
Mri!i»i»B)iiiei)iliiliteii5EflB Podemos calcular a dife- 
renga desta forma: 

Kffid tlO HUB ^ 
reslduo Q1 Q 2 = (—0,99) — (—0,112) 
■■■■ 

Voce deve notar que essa diferenga e o 
valor destacado na metade inferior da matriz 
jepf&duzt|aV(£rotulada de Residual (Resldu- 
os)) para as perguntas 1 e 2. Portanto, a parte 
inferior da matriz reproduzida contem as di- 
ferengas entre as correlagoes dos coeficientes 
observados e aquelas previstas pelo modelo. 
Para um bom modelo, todos esses valores se- 
rao pequenos. Na verdade, queremos que a 
maioria dos valores seja menor do que 0,05. 

clara quantos reslduos tern um valor absoluto 

maior do que 0,05. Para esses dados, existem 

tanto, se mais do que 50% sao maiores do que 


15.6.3 Rotagao de fatores © 

A primeira analise que pedi para voce exe- 
cutar foi usando a rotagao ortogonal. Entretan- 
to, foi solicitado que voce executasse a analise 
novamente usando a rotagao obllqua tambem. 
Nesta segao, os resultados de ambas as anali- 
ses serao relatados para destacar as diferengas 
entre as saidas. Essa comparagao tambem sera 
util para mostrar as circunstancias em que um 
tipo de rotagao pode ser preferfvel a outra. 

15.6.3.1 Rotagao ortogonal (Varimax) © 

A Saida 15.8 do SPSS mostra a matriz dos 
componentes apos a rotagao (tambem chama- 
da de matriz dos fatores rotacionada na analise 
de fatores), que e a matriz da carga dos fatores 
para cada variavel em cada fator. Essa matriz 
contem a mesma informagao que a matriz dos 
componentes na Saida 15.5 do SPSS, exceto 
que ela e calculada apos a rotagao. Existem va- 
rios pontos a considerar sobre o formato dessa 
matriz. Primeiro, as cargas de fatores menores 
do que 0,4 nao foram exibidas porque pedimos 
que as cargas fossem suprimidas usando a op¬ 
gao da Figura 15.10. Se voce nao selecionou 
essa opgao ou nao ajustou o valor criterio para 
0,4, sua salda sera diferente. Segundo, as varia- 
veis estao listadas por ordem de tamanho das 
suas cargas dos fatores. Por omissao, o SPSS 
ordena as variaveis como elas estao no editor de 
dados; entretanto, solicitamos que a salda fosse 
Ordenada por tamanho (Sorted by size) usando 
a opgao da Figura 15.10. Se essa opgao nao foi 
selecionada, sua salda sera diferente. Finalmen- 
te, para todas as outras partes da salda, suprimi 
os rotulos das variaveis (por motivo de espago), 
mas para essa matriz permiti a impressao dos 
rotulos da matriz para auxiliar na interpretagao. 

A logica original por tras da supressao de 
cargas menores do que 0,4 foi baseada na suges- 
tao de Stevens (1992) de que esse ponto de corte 
era apropriado para facilitar a interpretagao (isto 
e, cargas maiores do que 0,4 representam valores 
substanciais). Porem, isso significa que suprimi- 
mos muitas cargas que sao, sem diivida, signifi- 
cativas (veja a Segao 15.3.6.2). Entretanto, aqui 
a propria significancia nao e importante. 
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Saida 15.8 do SPSS 


Rotated Component Matrix 3 (Matriz dos Componentes Rotacionada) 



Component (Componente) 

7 

2 

3 

4 

Eu tenho pouca experiencia com computadores. 

0.800 




0 SPSS sempre trava quando eu tento usa-lo. 

0.684 




Eu tenho medo de provocar danos irreparaveis por causa da minha 

0647 




incompetencia com computadores. 





Todos os computadores me odeiam. 

0.638 




Computadores tem suas proprias mentes e deliberadamente erram 

0.579 




quando eu os uso. 





Os computadores sao uteis somente para jogos. 

0.550 




Computadores existem para me sacanear. 

0.459 




Eu nao consigo dormir quando penso em autovetores. 


0.677 



Eu tenho pesadelos com a distribuigao normal. 


0.661 



Desvios padrao me excitam. 


-0.567 



Dizem que o SPSS torna a estatistica mais facil de entender, mas isso 

0.473 

0.523 



nao e verdade. 





Eu sonho com Pearson me atacando com coeficientes de correlagao. 


0.516 



Eu choro escancaradamente quando ougo falar em tendencia central. 


0.514 



A estatistica me faz chorar. 


0.496 



Eu nao entendo estatistica. 


0.429 



Eu nunca fui bom em matematica. 



0.833 


Eu entro em coma toda vez que vejo uma equagao. 



0.747 


Eu fui muito mal em matematica na escola. 



0.747 


Meus amigos sao melhores em estatistica do que eu. 




0.648 

Meus amigos sao melhores com o SPSS do que eu. 




0.645 

Eu sou bom em estatistica e as pessoas acham que sou um CDF. 




0.586 

Meus amigos pensarao que sou estupido por nao saber mexer com 




0.543 

o SPSS 





Todos olham para mim quando uso o SPSS. 




0.427 


(Metodo de Extragao: Analise dos Componentes Principais. 
Metodo de Rotagao: Varimax com normalizagao de Kayser. 
a A rotagao convergiu em 9 iteragoes. 


Component Transformation Matrix 
(Matriz de Transformagao dos Componentes) 


Component 

(Componente) 

7 

2 

3 

4 

i 

0.635 

0.585 

0.443 

-0.242 

2 

0.137 

-0.168 

0.488 

0.846 

3 

0.758 

-0.513 

-0.403 

0.008 

4 

0.067 

0.605 

-0.635 

0.476 


Metodo de Extragao: Analise dos Componentes Principais. 
Metodo de Rotagao: Varimax com normalizagao de Kayser. 


Compare essa matriz com a solugao 
nao-rotacionada (Saida 15.5 do SPSS). Antes 
da rotagao, a maioria das variaveis estava alta- 
mente carregada no primeiro fator e os fatores 
restantes nao foram examinados. Entretanto, a 
rotagao da estrutura do fator deixou tudo mais 
claro: existem quatro fatores e as variaveis es- 

tao altamente carregadas em somente um fator 


(com a excegao de uma pergunta). A supressao 
de cargas menores do que 0,4 e a ordenagao 
das va m*,i' eis pelo tarnanho da carga tambem 
torna a interpretagao mais facil (porque voce 
nao precisa examinar cuidadosamente a matriz 

para identificar cargas substanciais). 

perguntas que estao carregadas no mesmo fa- 
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tor para tentar identificar temas comuns. Se 

o fator matematico produzido pela analise 
representa um construto real, temas comuns 

entre perguntas com cargas altas podem nos 
ajudar a identificar o que o construto pode ser. 
As perguntas com cargas altas no fator 1 pare- 
cem ter relacao com o uso de computadores e 

o SPSS. Portanto, podemos rotular esse fator 
de medo de computador ( fear of computers). 
As perguntas com cargas altas no fator 2 pa- 
recem ter relacao a diferentes aspectos da es¬ 
tatistica, portanto, podemos rotular esse fator 
de medo da estatistica (fear of statistics). As 

recem estar relacionadas a matematica, assim, 
podemos rotular esse fator de medo de mate¬ 
matica (fear of mathematics). Finalmente, as 

algum componente de avaliagao social de 

amigos, desse modo, podemos rotular esse fa¬ 
tor de avaliagao dos pares (peer evaluation). 
Essa analise revela que o questionario inicial 
e composto por quatro subescalas: medo de 
computadores, medo de estatistica, medo de 
matematica e medo da avaliagao negativa dos 
amigos. Existem duas possibilidades. A pri- 
meira e',que 0 QAS falhou em medif o tema 
projetado, a ansiedade em relacao ao SPSS, 
mas mede alguns construtos relacionados. 

A segunda e que esses quatro construtos sao 
subcomponentes da ansiedade em relacao ao 
SPSS; Wlet4!iflH9HRMHHll3Hiii< : > in- 
dica qttal dessas possibilidades e verdadeira. 

Essa matriz fornece informagao sobre o grau 

que os fatores foram rotacionados para obter 
a solugao. Se nao houve necessidade de ro¬ 
tagao, essa matriz sera uma matriz de iden- 
tidade. Se a rotagao ortogonal foi comple- 
tamente apropriada, podemos esperar uma 

matriz simetrica (mesmos valores acima e 

abaixo da diagonal). Entretanto, na reali¬ 
dade, a matriz nao e de facil interpretacao, 
embora matrizes nao-simetricas possam ser 

tomadas como um motivo para tentar a ro¬ 

tagao obliqua. Talvez seja melhor ignorar a 
matriz de transformagao dos fatores. 


15.6.3.2 Rotagao obliqua © 

Quando uma rotagao obliqua e conduzida, 
a matriz dos fatores e dividida em duas matri¬ 
zes: a matriz padrao (pattern matrix) e a matriz 
de estrutura (structure matrix) (veja o Quadro 
15.1). Para a rotagao ortogonal, essas matrizes 
sao as mesrnas. A matriz padrao contern as 
cargas dos fatores e e comparavel a matriz dos 
fatores que interpretamos para a rotagao orto¬ 
gonal. A matriz estrutural leva em conta o rela- 
cionamento entre fatores (na verdade, ela e um 
produto da matriz padrao e da matriz contendo 
os coeficientes de correlagao entre fatores). A 
maioria dos pesquisadores interpreta a matriz 
padrao porque ela e geralmente mais simples; 
entretanto, existem situagoes nas quais valores 
na matriz padrao sao suprimidos por causa dos 
relacionamentos entre valores. Portanto, a ma¬ 
triz estrutural e util para uma revisao e Graham 
e colaboradores. (2003) recomendam relatar 
ambas (com alguns exemplos uteis de por que 
isso pode ser importante). 

Para a matriz padrao desses dados (Saida 
15.9 do SPSS), os mesmos quatro fatores pare- 
cem ter emergido (embora para algumas varia- 
veis as cargas dos fatores sejam muito pequenas 
para serem exibidas). O fator 1 parece repre- 
sentar o medo de estatistica, o fator 2 represen¬ 
ta o medo da avaliagao dos seus pares, o fator 

3 representa o medo de computadores e o fator 

4 representa o medo de matematica. A matriz 
estrutural (Saida 15.10 do SPSS) difere, pois 
a variancia compartilhada nao e ignorada. O 
quadro se torna mais complicado porque, com 
excegao do fator 2, muitas variaveis tern altas 
cargas em mais do que um fator. Isso ocorreu 
devido ao relacionamento entre os fatores 1 e 3 
e os fatores 3 e 4. Esse exemplo destaca por que 
a matriz padrao e preferivel na interpretagao: 
porque ela contern informagao sobre a contri- 
buigao unica de uma variavel a um fator. 

A parte final da saida e a matriz de corre- 
lagoes entre os fatores (Saida 15.11 do SPSS). 
Essa matriz contern os coeficientes de correla¬ 
gao entre os fatores. Como foi previsto da ma¬ 
triz estrutural, o fator 2 tern pouco ou nenhum 
relacionamento com qualquer outro fator (os 
coeficientes de correlagao sao baixos), mas to- 
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Saida 15.9 do SPSS 


Pattern Matrix 3 (Matriz Padrao) 



Component (Componente) 

1 

2 

3 

4 

Eu nao consigo dormir quando penso em autovetores. 

0.706 




Eu tenho pesadelos com a distribuigao normal. 

0.591 




Desvios padrao me excitam. 





Eu sonho com Pearson me atacando com coeficientes de correlagao. 

-0.511 




Eu choro escancaradamente quando ougo falar em tendencia central. 

0.405 




A estatistica me faz chorar. 

0.400 




Eu nao entendo estatistica. 


0.643 



Meus amigos sao melhores com o SPSS do que eu. 


0.621 



Meus amigos sao melhores em estatistica do que eu. 


0.615 



Sou bom em estatistica e as pessoas acham que sou CDF. 


0.507 



Meus amigos irao pensar que eu sou estupido por nao saber mexer com 



0.885 


o SPSS. 





Todos olham para mim quando uso o SPSS. 



0.713 


Eu tenho pouca experiencia com computadores. 



0.653 


0 SPSS sempre trava quando eu tento usa-lo. 



0.650 


Todos os computadores me odeiam. 



0.588 


Eu tenho medo de provocar danos irreparaveis por causa da minha in- 



0.585 


competencia com computadores. 





Computadores tem suas proprias mentes e deliberadamente erram 

0.412 


0.462 


quando eu os uso. 





Os computadores sao uteis somente para jogos. 



0.411 


Dizem que o SPSS torna a estatistica mais facil de entender, mas isso 





nao e verdade. 





Computadores existem para me sacanear. 





Eu nunca fui bom em matematica. 




-0.902 

Eu entro em coma toda vez que vejo uma equagao. 




-0.774 

Eu fui muito mal em matematica na escola. 




-0.774 


Metodo de Extragao: Analise dos Componentes Principais. 
Metodo de Rotagao: Oblimin com normalizagao de Kayser. 
a A rotagao convergiu em 29 iteragoes. 


r 


Dicas da Samantha Ferrinho: Interpretagao 


A 



V. 


• Se voce conduziu uma rotagao ortogonal, olhe para a tabela Matriz dos Com- 

ip it i ip" R it ado . '■> 1 >c | C > j ■> * Va‘ r _ H rj i j I ■ 1,1 ->1- _ ,t i $ 

o componente para o qual a variavel tem a carga maior. Tambem, para cada 
componente observe as variaveis que tem altas cargas nele (alta significa que 
as cargas devem estar acima de 0,4 quando voce ignorar o sinal de mais ou 
menos). Tente entender o que os fatores representam observando os temas 

comuns nos itens que tem cargas. 

• Se voce conduziu a rotagao obliqua, olhe para a tabela Matriz Padrao (Pattern 
Matrix). Para cada variavel, observe o componente para o qual a variavel tem a 
carga mais alta. Tambem, para cada componente, observe as variaveis que tem 
a carga mais alta nele (alta significa que as cargas devem estar acima de 0,4 
ignorando o sinal de mais ou menos). Reexamine o que voce encontrarfazendo 

o mesmo para a Matriz de Estrutura (Structure Matrix). Tente entender o que os 
fatores representam procurando por temas comuns nos itens que tem cargas. 
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Saida 15.10 do SPSS 


Structure Matrix (Matriz de Estrutura) 



Component (Componente) 

1 

2 

3 

4 

Eu tenho pesadelos com a distribuigao normal. 

0.695 


0.477 


Eu nao consigo dormir quando penso em autovetores. 

0.685 




Desvios padrao me excitam. 

-0.632 


-0.407 


Eu choro escancaradamente quando ougo falar em tendencia central. 

567 


0.516 

-0.491 

Sonho com Pearson me atacando com os coeficientes de correlagao. 

0.548 


0.487 

-0.485 

A estatistica me faz chorar. 

0.520 


0.413 

-0.501 

Eu nao entendo estatistica. 

0.462 


0.453 


Meus amigos sao melhores com o SPSS do que eu. 


0.660 



Meus amigos sao melhores em estatistica do que eu. 


0.653 



Eu sou bom em estatistica e as pessoas acham que sou um CDF. 


0.588 



Meus amigos irao pensar que eu sou estupido por nao saber mexer com 


0.546 



o SPSS 





Todos olham para mim quando uso o SPSS. 

-0.435 

0.446 



Eu tenho pouca experiencia com computadores. 



0.777 


0 SPSS sempre trava quando eu tento usa-lo. 

0.404 


0.761 


Todos os computadores me odeiam. 

0.401 


0.723 


Eu tenho medo de provocar danos irreparaveis por causa da minha in- 



0.723 

-0.429 

competencia com computadores. 





Computadores tern suas proprias mentes e deliberadamente erram quan- 

0.426 


0.671 


do eu os uso. 





Dizem que o SPSS torna a estatistica mais facil de entender, mas isso 

0.576 


0.606 


nao e verdade. 





Computadores existem para me sacanear. 



0.561 

-0.441 

Os computadores sao uteis somente para jogos. 



0.556 


Eu nunca fui bom em matematica. 




-0.855 

Eu entro em coma toda vez que vejo uma equagao. 



0.453 

-0.822 

Eu fui muito mal em matematica na escola. 



0.451 

-0.818 


Metodo de Extragao: Analise dos Cormponentes Principals. 
Metodo de Rotagao: Oblimin com norrnalizagao de Kayser. 


Saida 15.11 do SPSS 


Component Correlation Matrix (Matriz 
das Correlates dos Componentes) 


Component 

(Componente) 

1 

2 

3 

4 

i 

1.000 

-0.154 

0.364 

-0.279 

2 

-0.154 

1.000 

-0.185 

8.155E-02 

3 

0.364 

-0.185 

1.000 

-0.464 

4 

-0.279 

8.155E-02 

-0.464 

1.000 


Metodo de Extragao: Analise dos Componentes Principais. 
Metodo de Rotacao: Oblimin com norrnalizagao de Kayser. 


dos os outros fatores estao inter-relacionados 
a um determinado grau (notavelmente os fato¬ 
res 1 e 3 e os fatores 3 e 41. i^fM o vd^Ejiiatgs sgsr 
correlates existem indica que os construtos 

medidos podem estar inter-relacionados.ifps: 
os construtos fossem independentes, espera- 

riamos que a rotacao oblfqua fornecesse uma 


solucao identica para uma rotacao ortogonal 
e a matriz de correlagao do componente de- 

veria ser uma matriz de identidade (isto e, to- 
dos os fatores tern coeficientes de correlagao 

igual aiO|;i Portanto, essa matriz final indica 
se e razoavel assumir a independencia entre 
os fatores: para esses dados parece que nao 
podemos assumir independencia. Portanto, 
os resultados da rotagao ortogonal podem nao 
ser confiaveis: a solugao da rotagao oblfqua e, 
provavelmente, mais apropriada. 

N «n i iWi.' dihSffk mVwic ih>9 

sos fatores nao causa preocupagao; podemos es- 
perar um relacionamento bem forte entre medo 
de matematica, medo de estatistica e medo de 
computadores. Geralmente pessoas com menos 
inclinagao a matematica lutam com a estatistica. 
Entretanto, nao esperamos que esses construtos 

se correlacionem com o medo de avaliagao dos 
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seus pares (porque esses construtos tem base 

mais social). De fato, esse fator e o que menos 
se correlaciona com os outros - assim, num nf- 

vel teorico, as coisas acabaram muito bem! 

15.6.4 Escores do fator © 

Depois de encontrar uma solucao adequa- 
da e fazer a rotagao daquela solucao, podemos 
olhar os escores do fator. A Saida 15.12 do 
SPSS mostra a matriz dos escores do compo- 
nente B (veja a Seqao 15.2.4), da qual os es¬ 
cores do fator sao calculados e a matriz das 
covariancias dos escores do fator. A matriz dos 
escores do componente nao e particularmente 
util. Ela pode ser util na compreensao de como 
os escores do fator foram calculados, mas com 
grandes conjuntos de dados como esse, nao e 
provavel que voce queira pesquisar a matema- 
tica por tras dos escores do fator. Entretanto, a 
matriz das covariancias dos escores e util. Essa 
matriz nos mostra os relacionamentos entre os 
escores do fator (ela e uma matriz de correlacao 
nao-padronizada). Se os escores do fator nao 
sao correlacionados, essa matriz deve ser uma 
matriz de identidade (isto e, elementos diago¬ 
nals serao 1, mas todos os outros elementos 
sao 0). Para esses dados, todas as covariancias 
sao zero (lembrando que 4,37E-16 e realmente 
0,000000000000000437), indicando que os es¬ 
cores resultantes nao sao correlacionados. 

Na analise original, pedimos que os es¬ 
cores fossem calculados baseados no meto- 
do de Anderson-Rubin (por isso eles nao sao 
correlacionados). Voce encontrara esses es¬ 
cores no editor de dados. Deve haver quatro 
novas colunas de dados (uma para cada fator) 
rotuladas de FAC1_1, FAC2_1, FAC3_1 e 
FAC4_1, respectivamente. Se voce pedir por 
escores dos fatores na rotagao oblfqua, esses 
escores aparecerao no editor de dados em ou- 
tras quatro colunas rotuladas de FAC2_1 e as¬ 
sim por diante. Esses escores do fator podem 
ser listados no visualizador de safda usando 
o comando Analyze=»RejH>rts=>Case Sum- 
maries... (Analisar=>Relatar=>Resumir Ca- 
sos...) (veja a Segao 5.8.6). Como existem 
mais do que 1500 casos, voce pode querer 
restringir a safda dos primeiros 10 ou 20. A 


Saida 15.12 do SPSS 


Component Score Coffcient 
Matrix (Matriz dos Coeficientes dos 
Escores dos Componentes) 



Component (Componente) 

7 

2 

3 

4 

Q01 

-0.053 

0.173 

0.089 

0.110 

Q02 

0.102 

-0.129 

0.086 

0.281 

Q03 

0.087 

-0.195 

0.013 

0.137 

Q04 

-0.011 

0.170 

0.045 

0.107 

Q05 

0.021 

0.131 

0.014 

0.083 

Q06 

0.383 

-0.211 

-0.088 

0.014 

Q07 

0.213 

0.004 

-0.078 

0.038 

Q08 

-0.129 

-0.074 

0.460 

0.013 

Q09 

0.025 

-0.029 

0.108 

0.354 

Q10 

0.244 

-0.161 

-0.021 

-0.036 

Q11 

-0.066 

-0.087 

0.379 

-0.059 

Q12 

0.097 

0.161 

-0.116 

0.051 

Q13 

0.224 

-0.065 

-0.019 

0.013 

Q14 

0.180 

0.040 

-0.084 

0.043 

Q15 

0.114 

-0.055 

0.061 

-0.058 

Q16 

-0.015 

0.146 

0.046 

0.014 

Q17 

-0.057 

-0.067 

0.372 

0.005 

Q18 

0.242 

-0.001 

-0.104 

0.043 

Q19 

0.048 

-0.115 

0.061 

0.199 

Q20 

-0.195 

0.359 

-0.061 

-0.002 

Q21 

-0.039 

0.270 

-0.064 

0.059 

Q22 

-0.036 

0.162 

-0.048 

0.382 

Q23 

0.032 

0.211 

-0.162 

0.379 


Metodo de Extragao: Analise dos Componentes Principais. 
Metodo de Rotagao: Varimax com normalizagao de Kayser. 


Component Score Covariance Matrix (Matriz 
das Covariancias dos Escores dos Componentes) 


Component 

(Componente) 

1 

2 

3 

4 

i 

1.000 

1.093E-16 

0.000 

0.000 

2 

1.093E-16 

1.000 

4.373E-16 

0.000 

3 

0.000 

4.373E-16 

1.000 

0.000 

4 

0.000 

0.000 

0.000 

1.000 


Metodo de Extragao: Analise dos Componentes Principais. 
Metodo de Rotagao: Varimax com normalizagao de Kayser. 


Safda 15.13 do SPSS mostra os fatores do es- 
core para os primeiros 10 participantes. Deve 
estar bem claro que o participante 9 teve um 
escore alto em todos os quatro fatores e, as¬ 
sim, essa pessoa tem muita ansiedade quanto 
a estatfstica, informatica e matematica, mas 
menos quanto a avaliagao dos seus pares (fa¬ 
tor 4). Os escores do fator podem ser usados 
dessa maneira para avaliar o medo relativo de 
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Saida 15.13 do SPSS 


Case Summaries a (Resumo de casos) 



Case Number 
(Caso Numero) 

FAC1_1 

FAC2 2 

FAC3 3 

FAC4 4 

1 

i 

0.10584 

-0.92797 

-1.82768 

-0.45958 

2 

2 

-0.58279 

-0.18934 

-0.04137 

0.29330 

3 

3 

-0.54761 

0.02968 

0.19913 

-0.97142 

4 

4 

0.74664 

0.72272 

-0.68650 

-0.18533 

5 

5 

0.25167 

-0.51497 

-0.63353 

0.68296 

6 

6 

1.91613 

-0.27351 

-0.68205 

-0.52710 

7 

7 

-0.26055 

-1.40960 

-0.00435 

0.90986 

8 

8 

-0.28574 

-0.91775 

-0.08948 

1.03732 

9 

9 

1.71753 

1.15063 

3.15671 

0.81083 

10 

10 

-0.69153 

-0.73340 

0.18379 

1.49529 


a Limitado aos primeiros 10 casos. 


uma pessoa comparado com outra, ou pode- 
mos adicionar os escores para obter um unico 
escore para cada participante (que podemos 
assumir que representa a ansiedade do SPSS 
como um todo). Podemos, tambem, usar os 
escores do fator em regressao quando grupos 
de previsores se correlacionam de tal forma 
que ha multicoliuearidade. 

15.6.5 Resumo © 

A analise revela quatro escalas subjacen- 
tes em nosso questionario que podem ou nao 

se relacionar a subcomponentes genuinos da 
ansiedade em relagao ao SPSS. Uma solucao 
utilizando uma rotagao obliqua foi preferida 
devido as inter-relagoes entre os fatores. O uso 
da analise dos fatores e exploratorio; ela deve 
ser usada somente para guiar futuras hipoteses 
ou informar aos pesquisadores sobre os pa- 
droes dentro dos conjuntos de dados. Muitas 
decisoes sao deixadas aos pesquisadores usan- 
do a analise dos fatores e eu recomendo que 
voce tome decisoes bem-informadas em vez 
de basear suas decisoes nas saidas que voce 
gostaria de conseguir. A proxima pergunta e 
se a escala e ou nao confiavel. 

15.7 ANALISE DE CONFIABILIDADE© 
15.7.1 Medidas de confiabilidade © 

Se voce estiver usando a analise de fa¬ 
tores para validar um questionario, e acon- 
selhavel checar a confiabilidade da escala. 


Confiabilidade signifi- 
ca apenas que a escala 
deve, consistentemen- 
te, refletir o construto 
que esta medindo. Uma 
maneira de definir isso 
e que, mantendo todo o 
resto igual, uma pessoa 
deve ter um mesmo escore num questionario 
se ela completa-lo em dois pontos diferentes 
no tempo (isso e chamado de confiabilidade 
de teste-reteste). Assim, alguem que tenha pa- 
vor de estatistica e que teve altos escores no 
nosso QAS deve ter escores similarmente al¬ 
tos se o testarmos um mes depois (assumindo 
que ele nao tenha feito algum tipo de terapia 
para tratar a ansiedade em relacao a estatistica 
no ultimo mes). Outra maneira de analisar a 
confiabilidade e afirmar que duas pessoas sen- 
do medidas, que sao as mesmas em termos de 
construto, devem ter o mesmo escore. Assim, 
se pegarmos duas pessoas que tinham fobia a 
estatistica, elas devem ter, mais ou menos, es¬ 
cores identicos no QAS. Da mesma forma, se 
pegarmos duas pessoas que adoram estatistica, 
ambas devem ter escores igualmente baixos. 
Portanto, se pegarmos alguem que adora esta¬ 
tistica e alguem que odeia e eles alcangarem o 
mesmo escore no nosso questionario, nao seria 
uma medida precisa da ansiedade em relagao 
a estatistica! Em termos estatisticos, a manei- 
iiiiiiilfifEjgfa MS 

seada na ideia de que itens individuals (ou um 
conjunto de itens) devem produzir resultados 
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consistentes em todo o questionario. Assim, 

se tomarmos alguem com medo de estatfstica, 

e confiavel e se nos aleatoriamente selecionar- 

naqueles itens tambem devera ser alto. 

A maneira mais simples de fazer isso na 
pratica e usar a confiabilidade meio-a-meio 
( split-half reliability). Esse metodo divide, 
aleatoriamente, o conjunto de dados em dois. 
Um escore para cada participante e calcula- 
do em cada metade da escala. Se a escala for 
confiavel, o escore da pessoa numa metade da 
escala deve ser o mesmo (ou similar) ao seu 
escore na outra metade: portanto, atraves de 
varios participantes os escores das duas meta- 
des do questionario devem ter uma correlagao 
bastante alta. A correlacao entre as duas me- 
tades e a estatfstica calculada nesse metodo, 
com grandes correlacbes indicando confiabi¬ 
lidade. O problema desse metodo e que exis- 
tem varias maneiras de dividir um conjunto de 
dados em dois e, assim, os resultados podem 
resultar da forma como os dados sao dividi- 
dos. Para solucionar esse problem a. tfifi nBiB 
<Milll»ait iri'nte^iftnu'>iiiiKl t iiie ttigjl» a!‘jni<.iiiL> 

todas as maneiras possfveis e com coeficien- 

te de correlacao calculado para cada parte. 
A media desses valores e o alfa de Cronbach 
(Cronbach alpha), a medida mais comum de 
confiabilidade. 9 


9 Embora essa seja a maneira mais facil de conceitua- 
lizar o alfa de Cronbach, a, ser ou nao exatamente 
igual a media de todas as possiveis confiabilidades 
meio-a-meio depende exatamente de como voce cal- 
culou a confiabilidade meio-a-meio (veja o glossa- 
rio para detalhes computacionais). Se voce utilizar 
a formula de Spearman-Brown, a qual nao leva em 
consideragao os desvios padrao dos itens, o a de 
Cronbach sera igual a media da confiabilidade meio- 
-a-meio somente quando os desvios padrao dos itens 
sao iguais; caso contrario, a, sera menor do que a 
media. Entretanto, se voce usar uma formula para 
a confiabilidade meio-a-meio que leva em conta os 
desvios padrao para os itens (tal como Flanagan, 
1937; Rulon, 1939), a sera sempre igual a media da 
confiabilidade meio-a-meio (veja Cortina, 1993). 


O a de Cronbach e dado por: 


N 2 Cov 

) ^ Y[lem ; COV item 


(15.6) 


o qual pode parecer complicado, mas na 
verdade nao e. Observe que para cada item na 
nossa escala podemos calcular duas coisas: a 
variancia dentro do item e a covariancia entre 
um item particular e qualquer outro item na 
escala. Colocando de outra forma, podemos 
construir uma matriz de variancias-covarian- 
cias de todos os itens. Nessa matriz, os ele- 
mentos diagonals serao as variancias dentro de 
um item particular e os elementos fora da dia¬ 
gonal serao covariancias entre pares de itens. 
O numerador da equacao e simplesmente o nu- 
mero dos itens (AO ao quadrado multiplicado 
pela media da covariancia entre itens (a media 
dos elementos fora da diagonal na matriz de 
variancias-covariancias acima mencionada). O 
denominador e apenas a soma de todas as vari¬ 
ancias e covariancias do item (isto e, a soma de 
tudo na matriz de variancias-covariancias). 

Tambem existe uma versao padroniza- 
da do coeficiente, a qual essencialmente usa 
a mesma equagao, exceto que as correlacbes 
sao usadas em vez das covariancias, e no de¬ 
nominador da equacao usamos a soma dos 
elementos da matriz de correlacoes dos itens 
(incluindo aqueles que aparecem na diago¬ 
nal daquela matriz). O a normal e apropria- 
do quando os itens numa escala sao somados 
para produzir um escore simples para aquela 
escala (o a padronizado nao e apropriado nes¬ 
ses casos). O a padronizado e util quando os 
itens de uma escala sao padronizados antes de 
serem somados. 


15.7.2 Interpretando o a de Cronbach 
(advertencias) © 

Geralmente afirma-se que um valor de 0,7- 
0,8 e aceitavel para o a de Cronbach e valores 
substancialmente mais baixos indicam uma 
escala nao confiavel. K§f§fe (1999) registra que 
embora o valor comumente aceito de 0,8 seja 
apropriado para testes cognitivos como o teste 
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de inteligencia, para testes de habilidade urn 
ponto de corte de 0,7 e mais adequado. Ele 
tambem afirma que quando se tratar de cons- 

dem ser esperados, por causa da diversidade 
dos construtos que estao sendo medidos. 

Entretanto, Cortina (1993) registra que tais 
procedimentos gerais precisam ser usados com 
cautela porque o valor de a depende do niime- 
ro de itens na escala. Voce pode verificar que o 
numerador da equagao para o a inclui o numero 
de itens elevado ao quadrado. Portanto, a me- 
dida que o numero de itens da escala aumenta, 

sfvel conseguir um valor alto para o a porque 
voce tern muitos itens na escala e nao porque 

ela seja confiavel! Por exemplo, Cortina regis¬ 
tra dados das duas escalas, ambos tendo a = 
0,8. A primeira escala tern somente tres itens e 
a media da correlagao entre os itens foi um res- 
peitavel 0,57; entretanto, a segunda escala tinha 
10 itens com uma correlagao media entre esses 
itens de um menos respeitavel 0,28. Claramen- 
te, a consistencia interna dessas escalas difere 

ambas sao confiaveis! 

A segunda interpretagao comum do a 
e que ele mede a “unidimensionalidade” ou 
a extensao em que a escala mede um fator 
subjacente ou construto. Essa interpretagao 
se origina pelo fato de que quando existe um 
fator subjacente aos dados, one uma medida 
da forga daquele fator (veja Cortina, 1993). 
Entretanto, Grayson (2004) demonstra que 
conjuntos de dados com o mesmo a podem 
ter estruturas bem diferentes. Ele mostrou que 
um a de 0,8 pode ser alcangado numa esca¬ 
la com um fator subjacente, com dois fatores 
moderadamente correlacionados e com dois 
fatores nao-correlacionados. Cortina (1993) 
tambem mostrou que com mais de 12 itens e 
correlagoes bem altas entre itens (r > 0,5), a 
pode alcangar valores por volta ou acima de 
0,7 (0,65 a 0,84). Esses resultados mostram 
que o a nao deve ser usado como uma me¬ 
dida da “unidimensionalidade”. Na verdade, 
Cronbach (1951) sugeriu que se varios fatores 
existem, a formula deve ser aplicada separa- 


damente a itens relacionados a diferentes fato¬ 
res. Em outras palavras, se o seu questionario 
tern subescalas, o a deve ser aplicado separa- 
damente a essas subescalas. 

Um aviso final e sobre itens que tern 
frases invertidas. Por exemplo, no QAS que 
usamos na parte da analise de fatores neste 
capitulo, tinhamos um item (pergunta 3) que 
foi formulada de maneira contraria a todos os 
demais itens. O item era “os desvios padrao 
me excitam”. Compare-o com qualquer outro 
item e voce vera que 
ele requer uma resposta 
contraria. Por exemplo, 
o item 1 e “a estatfsti- 
ca me faz chorar”. Se 
voce nao gosta de esta- 
tfstica, voce concorda 
plenamente com essa 
afirmagao e, assim, tera um escore de 5 na 
nossa escala. Para o item 3, se voce odeia es- 
tatfstica, desvios padrao provavelmente nao o 
excitam, assim, voce ira discordar totalmente 
e tera um escore de 1 na escala. Esses itens 
de frases invertidas sao importantes para re- 
duzir respostas tendenciosas; os participantes 

precisarao ler os itens com atengao. Para a 

analise dos fatores, essas frases invertidas nao 
important, o que acontece e que voce conse- 

do fator negativa). Entretanto, em analise de 
confiabilidade esses itens de escores reversos 
fazem realmente a diferenga. Para entender o 
porque, pense na equagao do a de Cronbach. 
Nessa equagao, o numerador incorpora a co- 
variancia media entre os itens. Se um item e 
uma frase invertida, ele tera um relacionamen- 
to negativo com os demais; portanto, as cova- 
riancias entre esse item e os outros itens serao 
negativas. A covariancia media e, obviamente, 
a soma das covariancias dividida pelo numero 
de covariancias, e incluindo um grupo de va¬ 
lores negativos, reduzimos a soma das covari¬ 
ancias e, portanto, tambem reduzimos o valor 
do a de Cronbach, porque o numerador da 
equagao fica menor. Em casos extremos, e ate 
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mesmo posslvel conseguir um valor negativo 
para o a de Cronbach simplesmente porque a 
magnitude das covariancias negativas e maior 
do que a magnitude das positivas! Urn a’fde 
Cronbach negativo nao faz muito sentido, mas 

realmente acontece, e se acontecer, pergunte a 

voce mesmo se voce nao incluiu alguns itens 

com frases invertidas! 

Se voce tiver itens com frases invertidas, 
deve, tambem, reverter a maneira de obter os 

escores antes de realizar a analise de confiabi- 
lidade. Isso e muito facil. Veja os dados do seu 
QAS, onde temos um item que esta com o esco- 
re de 1 = discorda totalmente, 2 = discorda, 3 
= nem concorda, nem discorda, 4 = concorda e 
5 = concorda totalmente. Isso e bom para itens 
em que a concordancia indica ansiedade com a 
estatlstica, mas para o item 3 (desvios padrao 
me excitam), a discordancia indica ansiedade 
em relagao a estatlstica. Para refletir isso nu- 
mericamente, precisamos reverter a escala tal 
que 1 = concorda totalmente, 2 = concorda, 3 
= nem concorda, nem discorda, 4 = discorda 
e 5 = discorda totalmente. Dessa maneira, uma 
pessoa ansiosa ainda tem 5 nesse item (porque 


ela discordaria totalmente), ou seja, nesse caso 
e preciso inverter a escala utilizada. 

Para fazer isso, encontre o valor maximo da 
sua escala de resposta (nesse caso, 5) e adicione 
1 a ela (assim, voce tem 6 nesse caso). Para cada 
pessoa, pegue esse valor e subtraia dele o escore 
que a pessoa realmente obteve. Assim, alguem 
com um escore 5 originalmente tera, agora, 6-5 
= 1 e alguem com escore 1 original tera 6 - 1 = 
5. Alguem no meio da escala com um escore de 
3 tera 6-3 = 3! Obviamente, levaria muito tem¬ 
po para fazer isso para cada pessoa, mas pode- 
mos usar o comando Transform=>Compute... 
(Transformar=>Calcular...) do SPSS para fazer 
isso automaticamente (veja a Se^ao 3.3.4). Vi- 
mos esse comando no Capltulo 3, e devemos en- 
trar com o nome da variavel que queremos tro¬ 
car no espago Target Variable (Variavel Alvo) 
(veja a Figura 15.11) (nesse caso, a variavel e 
chamada de q03). Voce pode usar um nome di- 
ferente, se quiser, mas o SPSS criara uma nova 
variavel e voce precisara lembrar ela na analise 
de confiabilidade. Portanto, em Numerical Ex¬ 
pression (Expressao Numerica), voce precisa 
dizer ao SPSS como calcular a nova variavel. 




Figura 15.11 Escore reverso do item 3 (q03) no SPSS. 
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Nesse caso, queremos pegar o escore original 
de cada pessoa no item 3 e subtrair de 6. Por- 
tanto, simplesmente digitamos 6 — q03 (o que 
significa 6 menos o valor encontrado na coluna 
rotulada de q03). Se voce usou o mesmo nome, 
quando clicar em <* obtera uma caixa de dia- 
logo pedindo se voce quer trocar a variavel 
existente; apenas clique em se quiser que os 
novos valores sejam trocados pelos antigos. A 
Figura 15.11 mostra esse processo. 

15.7.3 Analise de confiabilidade no 
SPSS© 

Vamos testar a confiabilidade do QAS 
usando os dados que estao em SAQ.sav. Ago¬ 
ra, voce deve ter os escores invertidos no item 
3 (veja acima), mas se voce nao quer ser in- 
comodado, carregue o arquivo SAQ(Item 3 
Reversed).sav em vez do arquivo SAQ.sav. 
Lembre, tambem, que eu disse que voce de- 
veria realizar a analise de confiabilidade nas 
subescalas individualmente. Se usarmos os 
resultados da rota^ao ortogonal (veja a Saida 
15.8 do SPSS), temos quatro subescalas: 

1. Subescala 1 (Medo de computadores): 
itens 6, 7, 10, 13, 14, 15, 18 

2. Subescala 2 (Medo de estatistica): itens 1, 
3,4, 12, 14, 10,21 

3. Subescala 3 (Medo de matematica): itens 
8, 11, 17 

4. Subescala 4 (Medo da avaliagao dos pa¬ 
res): itens 2, 9, 19, 22, 23 


Para realizar cada analise de confiabilidade 
nesses dados, voce precisa seguir o caminho do 
menu Analyze=>ScaIe=>Reability Analyis... 
(Analisar=>Escala=> Analise de Confiabilida¬ 
de...) para exibir a caixa de dialogo semelhan- 
te a da Figura 15.12. Selecione qualquer item 
da lista que voce quer analisar (para comegar, 
vamos analisar os itens da subescala medo de 
computadores) no lado esquerdo da caixa de 
dialogo e transfira-os para a caixa Items (Itens) 
clicando em _lJ. 

Selecionando o item de marcar List item 
labels (Listar os rotulos dos itens), voce obte¬ 
ra uma listagem dos rotulos de todas as varia- 
veis (o que pode ser util para checar com quais 
itens suas variaveis se relacionam). Existem 
varias analises de confiabilidade que voce 
pode executar, mas a que sera executada por 
omissao e o a de Cronbach. Voce pode trocar 
essa analise (para, por exemplo, a do metodo 
meio-a-meio) usando o quadro Model (Mode- 
lo), mas um bom metodo a ser utilizado e o 
metodo por omissao. 

Se voce clicar em I »—*«.-1 (Estatlsticas), ira 
acessar uma caixa de dialogo como a da Figu¬ 
ra 15.13. Na caixa de dialogo Statistics (Esta- 
tfsticas), voce pode selecionar varios fatores, 
mas o mais importante para a confiabilidade 
do questionario e: Scale if item deleted (Esca- 
la se o item for deletado). Essa opgao fornece 

sua escala. Ele nos diz qual seria o valor de a 



Figura 15.12 Caixa de dialogo principal para a analise de confiabilidade. 
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Figura 15.13 Estatlsticas para a analise de con- 
fiabilidade. 


item afete grandemente a confiabilidade. Em 
outras palavras, nenhum item deve causar um 

substancial decrescimo em a. Se ele causar, isso 
e preocupante e voce deve considerar tirar aque- 
le item do questionario. Como 0,8 e visto como 
um bom valor de a, esperamos que todos os va- 
lores de alpha if item deleted (alfa se o item for 
i Id! eLjt lNifcS U i a n UPWiSt 111 uidgi'^lo u£iPi mJi 
As intercorrelacdes e covariancias entre 
itens nos fornecem coeficientes de correla¬ 
tes e medias para os itens na nossa escala. 
Ja vimos esses valores na nossa analise de 
fatores, portanto, nao vale a pena selecionar 
essas opcoes. Entretanto, se voce ainda nao 
fez a analise dos fatores, pode ser util pedir as 
correlates interitens porque o a global e afe- 
tado pelo numero de itens sendo analisado e, 
assim, voce deveria reexaminar para ver se os 
itens tem uma boa inter-rela^ao. Opcoes como 
a Tabela da ANOVA irao simplesmente com- 
parar tendencias centrais de itens diferentes do 
questionario usando um teste F. Ela aplica uma 
ANOVA de medidas repetidas de um fator nos 
itens do questionario, o qui-quadrado de Frie¬ 
dman (se os seus dados estao ordenados) ou 
o qui-quadrado de Cochran (se os seus dados 
sao dicotomicos, por exemplo, se os itens do 
questionario sao de respostas sim/nao). 


O T quadrado de Hotelling faz pratica- 
mente o mesmo, mas produz uma estatfstica 
multivariada equivalente ao teste F. Esses tes¬ 
tes sao uteis se voce quiser verificar se os itens 
tem distributes similares (isto e, o mesmo 
valor medio), mas dado o alto valor do tama- 
nho das amostras que voce deve estar usando, 
eles irao, inevitavelmente, produzir resultados 
significativos mesmo quando somente existam 
pequenas diferen^as entre as medias dos itens 
do questionario. 

Use o conjunto de opqoes como o da Fi¬ 
gura 15.13 para executar uma analise de con¬ 
fiabilidade basica. Clique em para retor- 
nar a caixa de dialogo principal e clique em 
<* para executar a analise. 

15.7.4 Interpretando a saida © 

A Saida 15.14 do SPSS mostra os resulta¬ 
dos dessa analise de confiabilidade basica para 
a subescala medo de computadores. Os valo¬ 
res na coluna Correted Item-Total Correlai- 
ton (Correlate total dos itens corrigidos) sao 
as correlates entre cada item e o escore total 
do questionario. Numa escala confiavel, todos 
os itens devem se correlacionar com o total. 
Assim, estamos procurando por itens que nao 
se correlacionam com o escore total da esca¬ 
la; se quaisquer desses valores sao menores 
do que aproximadamente 0,3 (depende leve- 
mente do tamanho da amostra - com amostras 
maiores, coeficientes de correlates menores 
sao aceitaveis), estamos com problemas por¬ 
que isso significa que um item especffico nao 
se correlaciona muito bem com toda a escala. 
Itens com baixa correlate talvez tenham que 
ser descartados. Para esses dados, todos os 
itens apresentam boas correlates com o total 
de itens, o que e animador. 

Os valores na coluna Alpha if Item Dele¬ 
ted (Alfa se item eliminado) sao os valores do 
a global se aquele item nao esta inclufdo nos 
calculos. Assim, eles refletem a mudanca no a 
de Cronbach que seria observada se um item 
particular fosse retirado. O a global e 0,823 
e, assim, todos os valores nessa coluna devem 
estar por volta desse mesmo valor. O que real- 
mente estamos procurando sao valores do a 
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Saida 15.14 do SPSS 


RELIABITY ANALYSIS 

SCALE (ALPHA) (Analise de 



Confiabilidade - Escala (Alfa)) 




Correlation Matrix 

(Matriz de Correlaqao) 




Q06 

Q07 Q10 

Q13 

Q14 Q15 

Q18 

Q06 

1.0000 





Q07 

0.5136 1 

. 0000 




Q10 

0.3222 0 

.2837 1.0000 




Q13 

0.4664 0 

.4421 0.3020 

1.0000 



Q14 

0.4022 0 

.4407 0.2547 

0.4498 

1.0000 


Q15 

0.3599 0 

.3914 0.2952 

0.3422 

0.3801 1.0000 


Q18 

0.5133 0 

.5009 0.2925 

0.5329 

0.4983 0.3429 

1.0000 

N of 

Cases = 2571.0 

(Numero de casos 

= 2571,0) 



Item 

-Total Statistics (Estatisticas 

Item-Total) 




Scale Mean If 

Scale Variance 

Corrected 

Squared 



Item Deleted 

if Item Deleted 

Item-total 

Multiple 

Alpha if 


(Media da 

(Variancia 

Correlation 

Correlation 

Item Deleted 


escala se 

da escala se 

(Correlaqao 

(Correlaqao 

(Alfa se o 


o item for 

o item for 

Item-total 

multipla ao 

item for 


retirado) 

retirado) 

corriqida) 

quadrado) 

retirado) 

QOS 

15.8650 

17.6141 

0.6187 

0.3981 

0.7906 

Q07 

15.1684 

17.7370 

0.6190 

3949 

0.7905 

Q10 

15.8114 

20.7360 

0.3999 

0.1665 

0.8239 

Q13 

15.6429 

18.8086 

0.6067 

0.3844 

0.7973 

Q14 

15.2159 

18.7188 

0.5768 

0.3504 

0.7980 

Q15 

15.3259 

19.3217 

0.4913 

0.2497 

0.8119 

Q18 

15.5235 

17.8324 

0.6474 

0.4475 

0.7855 

Reliability 

7 items (7 itens) 



Coefficients 





(Coeficientes de 





confiabilidade) 





Alpha = .8324 (Alfa 

Standardized item alpha = .8214 (Alfa 


= 0 . 

8324) 

Padronizado = 0 

.8214) 




maiores do que o a global. Se a eliminateao de 
um item aumenta o a de Cronbach, isso signi- 
fica que a elimina^o daquele item aumenta 
a confiabilidade. Portanto, qualquer item que 
resulte em valores substancialmente maiores 
do a do que o alfa a global talvez precisem ser 
eliminados da escala para aumentar sua con¬ 
fiabilidade. Nenhum dos itens aqui ira afetar 
substancialmente a confiabilidade se forem 
retirados. O pior transgressor e a pergunta 10: 
eliminando essa pergunta, o a ira aumentar de 
0,823 para 0,824. Contudo, esse aumento nao 
e significativo e os dois valores refletem um 
grau razoavel de confiabilidade. 


Finalmente, e talvez mais importante, o va¬ 
lor de Alfa na parte bem abaixo e o a de Cronba¬ 
ch: a confiabilidade geral da escala. Para reiterar, 
estamos procurando por valores na magnitude de 
0,7 para 0,8 (ou em tomo desses valores), tendo 
em mente que acabamos de observar sobre os 
efeitos do numero de itens. Nesse caso, o a esta 
levemente acima de 0,8 e esta na regiao indica- 
da por Kline, assim, provavelmente ele indica 
confiabilidade. Tambem e valido observar que 
se um item realmente precisa ser retirado nesse 

estagio, voce deve executar novamente sua ana- 

do item nao afetou a estrutura do fator! 
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Vamos continuar com a subescala medo 
de estatfstica (itens 1, 3, 4, 5, 12, 16, 20 e 21). 
Nao voltarei ao assunto do SPSS novamente, 
mas a Saida 15.15 do SPSS mostra os resulta- 
dos da analise (para economizar espaco, omiti 
as correla 9 oes interitens). Os valores na coluna 
Correlagao Total Corrigida dos Itens estao, no¬ 
vamente, todos acima de 0,3, o que e bom, e os 
valores na coluna Alfa se o item for deletado 
indica que nenhum dos itens aqui aumentaria a 
confiabilidade se fossem eliminados porque to- 
dos os valores nessa coluna sao menores do que 
a confiabilidade geral de 0,819. Assim como as 
duas subescalas anteriores, o a global esta em 
volta de 0,8, o que indica boa confiabilidade. 

Para entender a importancia dos escores 
reversos dos itens antes de executar a ana¬ 
lise de confiabilidade, observe que a Saida 
15.16 do SPSS mostra a analise de confia¬ 
bilidade para a subescala medo da estatfsti¬ 
ca, mas feita com os dados originais (isto e, 
sem reverter o item 3). Note que o a global 
e consideravelmente menor (0,606 em vez 
de 0,821). Observe, tambem, que esse item 


tern uma correlagao item-total negativa (que 
e uma boa maneira de mostrar que temos um 
potencial item reverso nos dados). Finalmen- 
te, note que para o item 3, o Alpha if Item 
Deleted (alfa se o item for deletado) e apro- 
ximadamente 0,80. Quer dizer, se o item for 
eliminado, a confiabilidade ira aumentar de 
0,6 para aproximadamente 0,8! Isso, eu espe- 
ro, ilustra que e preciso tomar cuidado com 
os itens que possam estar com as escalas in- 
vertidas, pois eles podem prejudicar bastante 
a confiabilidade de uma escala! 

Indo agora para a subescala medo da ma- 
tematica (itens 8, 11 e 17), a Saida 15.17 do 
SPSS mostra a safda dessa analise. Os valores 
na coluna Corrected Item-Total Correlation 
(Correlagao Item-total Corrigida) estao todos 
acima de 0,3, o que e bom, e os valores na co¬ 
luna Alpha if Item Deleted (alfa se o item 
for deletado) indicam que nenhum dos itens 
aumentara a confiabilidade caso sejam retira- 
dos porque todos os valores dessa coluna sao 
menores que o a confiabilidade global, 0,819. 
Assim como nas duas subescalas anteriores, 


Saida 15.15 do SPSS 


RELIABITY ANALYSIS - 

SCALE (ALPHA) (Analise de Confiabilidade - Escala (Alfa)) 

Item- 

fotal Statistics (Estatisticas Item-Total) 




Scale Mean If 


Corrected 

Squared 



Item Deleted 

Scale Variance 

Item-total 

Multiple 

Alpha if 


(Media da 

if Item Deleted 

Correlation 

Correlation 

Item Deleted 


escala se 

(Variancia da 

(Correlaqao 

(Correlagao 

(Alfa se o 


o item for 

escala se o item 

Item-total 

multipla ao 

item for 


retirado) 

for retirado) 

corrigida) 

quadrado) 

retirado) 

Q01 

21.7569 

21.4417 

0.5361 

0.3435 

0.8017 

Q03 

20.7165 

19.8250 

0.5492 

3093 

0.7996 

Q04 

21.3450 

20.4105 

0.5750 

0.3553 

0.7955 

Q05 

21.4088 

20.9422 

0.4944 

0.2724 

0.0866 

Q12 

20.9716 

20.6393 

0.5715 

0.3370 

0.7962 

Q16 

21.2517 

20.4507 

0.5973 

0.3886 

0.7928 

Q20 

20.5068 

21.1761 

0.4185 

0.2440 

0.8185 

Q21 

20.9603 

19.9385 

0.6061 

0.3988 

0.7908 

Reliability 

8 items (8 itens) 




Coefficients 





(Coeficientes de 





confiabi1idade) 





Alpha 

= .8208 

Standardized item alpha = .8234 



(Alfa 

= 0,8208) 

(Alfa Padronizado 

= 0,8234) 
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Saida 15.16 do SPSS 

RELIABITY ANALYSIS - SCALE (ALPHA) (Analise de Confiabilidade - Escala (Alfa)) 


Item-Total Statistics (Estatisticas Item-Total) 



Scale Mean If 

Item Deleted 
(Media da 
escala se 

o item for 
retirado) 

Scale Variance 

if Item Deleted 
(Variancia da 
escala se o item 
for retirado) 

Corrected 

Item-total 

Correlation 

(Correlagao 

Item-total 

corriqida) 

Squared 
Multiple 
Correlation 
(Correlagao 
multipla ao 
cruadrado) 

Alpha if Item 
Deleted (Alfa 
se o item for 
retirado) 

Q01 

20.9277 

12.1247 

0.5051 

0.3435 

0.5213 

Q03 

20.7165 

19.8250 

-0.5492 

0.3093 

0.7996 

Q04 

20.5158 

11.4467 

0.5260 

0.3553 

0.5048 

Q05 

20.5795 

11.7138 

0.4662 

0.2724 

0.5230 

Q12 

20.1424 

11.7393 

0.5006 

0.3370 

0.5154 

Q16 

20.4224 

11.5842 

0.5291 

0.3886 

0.5066 

Q2 0 

19.6776 

12.1073 

0.3528 

0.2440 

0.5576 

Q21 

20.1311 

11.1894 

0.5410 

0.3988 

0.4969 


Reliability 8 items (8 itens) 

Coefficients 
(Coeficientes de 
confiabilidade) 

Alpha = .6055 Standardized item alpha = .6413 

(Alfa = 0.6055) (Alfa Padronizado = 0.6413) 


Saida 15.17 do SPSS 

RELIABITY ANALYSIS - SCALE (ALPHA) (Analise de Confiabilidade - Escala (Alfa)) 


Item-Total Statistics (Estatisticas Item-Total) 


Scale Mean If 

Scale Variance 

Corrected 

Squared 


Item Deleted 

if Item Deleted 

Item-total 

Multiple 


(Media da 

(Variancia 

Correlation 

Correlation 

Alpha if Item 

escala se 

da escala se 

(Correlagao 

(Correlagao 

Deleted (Alfa 

o item for 

o item for 

Item-total 

multipla ao 

se o item for 

retirado) 

retirado) 

corrigida) 

quadrado) 

retirado) 

Q08 4.7219 

2.4701 

0.6845 

0.4704 

0.7396 

Qll 4.7036 

2.4530 

0.6818 

0.4672 

0.7422 

Q17 4.4920 

2.5037 

0.6520 

0.4251 

0.7725 

Reliability 
Coefficients 
(Coeficientes de 
confiabilidade) 

3 items (3 itens) 




Alpha = .8194 (Alfa 

Standardized item alpha = .8195 

(Alfa 


= 0,8194) 

Padronizado = 0,8195) 
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o ot global esta em torno de 0,80, o que indica 
uma confiabilidade boa. 

Finalmente, se voce executar a analise 
para a ultima subescala, a avaliacao pelos pa¬ 
res, voce obtera a Saida 15.18 do SPSS. Os 
valores na coluna Corrected Item-total Cor¬ 
relation (Correlagao Item-Total Corrigida) 
estao todos em volta de 0,3, exceto o item 23, 
que esta abaixo. Isso indica uma consisten- 
cia interna ruim e identifica o item 23 como 
o problema potencial. Os valores na coluna 
Alpha if Item Deleted (Alfa se item for dele- 
tado) indicam que nenhum dos itens da coluna 
aumentara a confiabilidade se forem elimina- 
dos porque todos esses valores sao menores 
do que a confiabilidade geral de 0,5699 (ou 
0,570, arredondando). Diferente das subes- 
calas anteriores, o a global e baixo (0,57) e, 
embora isso esteja de acordo com a afirma- 
cao de Kline que devemos esperar esse tipo 
de resultado nas ciencias sociais, ele esta bem 
abaixo das demais subescalas. Esta subescala 
tem cinco itens, comparada com sete, oito e 
tres das outras subescalas, assim, sua confia¬ 
bilidade reduzida nao sera significativamente 
afetada pelo numero dos itens (na verdade, 
ela tem mais itens do que a subescala medo 
de matematica). Se voce analisar os itens na 


subescala, vera que eles abordam temas diver- 
sos de avalia£ao dos seus pares, e isso pode 
explicar a falta de consistencia. Isso pode nos 
levar a repensar essa subescala. 

15.8 0QUEDESC0BRIM0SS0BRE 
ESTATISTICA? © 

Este capitulo abordou a analise de fato- 
res, uma tecnica para identificar aglomera- 
dos de variaveis que se relacionam. Uma das 
dificuldades da estatfstica e que ela pode ser 
subjetiva: muitos livros (inclusive este) dao 
a impressao de que a estatfstica e como um 
bom livro de receitas e, se voce seguir as ins- 
trugoes, fara um bolo de chocolate delicioso 
(hum!). A analise de fatores, talvez mais do 
que qualquer outro teste neste livro, mostra 
que isso nem sempre e assim. O mundo da es¬ 
tatfstica esta repleto de regras arbitrarias (a do 
0,05 e um exemplo classico) e, quase sempre, 
voce se dando conta ou nao, deve agir usando 
o seu proprio entendimento. Assim, eu espero 
que voce tenha descoberto o suficiente para 
trabalhar com a analise de fatores! Vimos que 
o primeiro estagio da analise de fatores e exa- 
minar as suas variaveis para verificar se elas 
se relacionam de algum modo, mas nao muito 


r 


Di 





V. 


• A analise de confiabilidade pode ser usadapara medir a consistenciade um 

• Lembre-se de reverter o escore de qualquer item que teve a frase invertida no 
questionario original antes de executar a analise. 

• Execute analises de confiabilidades separadas para todas as subescalas do 

• O a de Cronbach indica a confiabilidade geral do questionario, e valores por 
volta de 0,8 sao bons (ou 0,7 para testes de habilidade e similares). 

• A coluna alfa se o item for deletado (Alpha if Item Deleted) informa se a re- 
mogao de um item ira aumentar a confiabilidade geral: valores maiores do 
que a confiabilidade geral indicam que se removermos aquele item teremos 
aumento da confiabilidade geral da escala. Procure por itens que aumentem 
muito o valor de a. 

• Se voce realmente remover algum item, execute novamente a analise de fato¬ 

res para verificar se a estrutura dos fatores se mantem. 
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Saida 15.18 do SPSS 


RELIABITY ANALYSIS - 

SCALE (ALPHA) (Analise de Confiabilidade - Escala (Alfa)) 

Item- 

rotal Statistics (Estatisticas Item-Total) 




Scale Mean If 

Scale Variance 

Corrected 

Squared 



Item Deleted 

if Item Deleted 

Item-total 

Multiple 



(Media da 

(Variancia 

Correlation 

Correlation 

Alpha if Item 


escala se 

da escala se 

(Correlagao 

(Correlagao 

Deleted (Alfa 


o item for 

o item for 

Item-total 

multipla ao 

se o item for 


retirado) 

retirado) 

corrigida) 

quadrado) 

retirado) 

Q02 

11.4609 

8.1186 

0.3389 

0.1337 

0.5153 

Q09 

10.2380 

6.3955 

0.3907 

0.1674 

0. .4765 

Q19 

10.7923 

7.3810 

0.3162 

0.1060 

0.5218 

Q22 

10.1964 

7.2824 

0.3776 

0.1441 

0.4870 

Q23 

9.6499 

7.9879 

0.2389 

0.0689 

0.5628 

Reliability 

5 items 5 itens) 




Coefficients 





(Coeficientes de 





confiabilidade) 





Alpha 

= .5699 

Standardized item alpha = .5724 

(Alfa 


(Alfa 

= 0.5699} 

Padronizado = 0. 

5724) 




fortemente! A analise de fatores, propriamen- 
te dita, tem muitos estagios: verificar alguns 
assuntos (por exemplo, adcquacao do tama- 
nho da amostra), decidir quantos fatores reter 
e, finalmente, decidir quantos itens carregar 
nos fatores (e tentar entender o significado 
dos fatores). Tendo feito tudo isso, voce deve 
verificar se os itens que voce tem sao medidas 
confiaveis do que voce esta tentando medir. 

15.9 TERMOS-CHAVE QUE 
DESC0BRIM0S 

• Fatoraqao alfa 

• Metodo de Anderson-Rubin 

• Variancia comum 

• Comunalidade 

• Matriz do componente 

• Analise de fatores confirmatoria 

• a de Cronbach 

• Oblimin direto 

• Equamax 

• Extra§ ao 

• Fator 


• Analise de fatores 

• Carga dos fatores 

• Variancia aleatoria 

• Confiabilidade 

• Rotacao 

• Diagrama de declividade 

• Matriz do fator 

• Escores dos Fatores 

• Matriz de transformacao do fator A 

• Medida da adcquacao da amostra de Kai- 
ser-Meyer-Olkin (KMO) 

• O criterio de Kaiser 

• Variavel latente 

• Rotacao obliqua 

• Rotacao ortogonal 

• Matriz padrao 

• Analise dos componentes principals 

• Promax 

• Quartimax 

• Matriz estrutural 

• Confiabilidade teste-reteste 

• Variancia unica 

• Varimax 

• Confiabilidade meio-a-meio 
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15.10 TAREFAS DO ALEX ESPERTO 



• A Universidade de Sussex pro- 
cura empregar as melhores 
pessoas possfveis como pro- 
fessores (serio?). Ela queria 
revisar um questionario ba- 
seado na teoria de Bland sobre professo- 
res de metodos de pesquisa. Essa teoria 
preve que bons professores de metodos de 
pesquisa devem ter quatro caracteristicas: 
(1) amor profundo por estatistica; (2) en- 
tusiasmo por projeto experimental; (3) 
amor por ensinar e (4) completa ausencia 
de habilidades interpessoais normals. Es- 
sas caracteristicas devem estar relaciona- 
das (isto e, correlacionadas). O TOSSE 
(Teaching Of Statistics for Scientific Ex¬ 
periments*) ou ja existia, mas a universi¬ 
dade revisou esse questionario e ele se 
tornou o TOSSE-R ( Teaching Of Statis¬ 
tics for Scientific Experiments-Revised). 
A universidade deu esse questionario a 
239 professores de metodos de pesquisa 
em todo o mundo para ver se ele sustenta- 
va a teoria de Bland. O questionario esta 
apresentado na Figura 15.14 e os dados 
estao no arquivo TOSSE-R.sav. Realize 


uma analise de fatores (com a rotagao 
apropriada) para verificar a estrutura de 
fatores desses dados. (D 

15.11 LEITURAS COMPLEMENTARES 

CORTINA, J. M. What is coefficient alpha? An 
examination of theory and applications. Journal 
of Applied Psychology, 78, p. 98-104, 1993. Um 
artigo de boa leitura sobre o a de Cronbach. 

DUNTEMAN, G. E. Principal Components 
analysis. Sage university paper series on 
quantitative applications in the social sciences, 
07-69. Newbury Park (CA): Sage, 1989. Essa 
monografia e de alto nlvel, mas abrangente. 

FIELD, A. P. Designing a questionnaire. 

2000. Essa apostila fornece conselhos 
sobre como projetar questionarios e esta 
no material disponlvel no site no arquivo 
DesigningQuestionnaries.pdf. Vale a pena le- 
lo se voce quiser elaborar questionarios. 

PEDHAZUR, E„ SCHMELKIN, L. Measurement, 
design and analysis. Hillsdale (NJ): Erlbaum. 
1991. O Capltulo 22 e uma excelente 
introdugao a teoria da analise de fatores. 

TABACHNICK, B. G„ FIELD, L. S. Using 

multivariate statistics (4 111 edition). Boston: Allyn 
e Bacon. 2001. O Capltulo 13 tern uma visao 
tecnica, mas maravilhosa, da analise de fatores. 


* N. deT.: Em portugues, EEEC, Ensino de Estatistica 
para Experimentos Cientfficos. 
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DT = Discorda Totalmente, D = Discorda, N = Nem discorda, nem concorda, C = Concorda, CT = Concorda 
Totalmente 



DT 

D 

N 

c 

CT 

1 

Uma vez acordei em urn canteiro de vegetais abragado num nabo que eu havia 
arrancado por engano achando que fosse a maior raiz de Roy. 

O 

o 

0 

0 

0 

2 

Se eu tivesse uma arma, atiraria nos meus alunos. 

o 

o 

o 

0 

0 

3 

Eu memorizo valores de probabilidade para a distribuigao F. 

o 

o 

0 

0 

0 

4 

Eu adoro o santuario de Pearson. 

o 

o 

0 

0 

0 

5 

Eu ainda moro com minha mae e tenho poucos habitos de higiene. 

o 

o 

o 

0 

0 

6 

Ensinar os outros da vontade de engolir uma garrafa de alvejante - a dor do 
meu esofago queimando seria um alivio em comparagao. 

o 

o 

0 

0 

0 

7 

Ajudar os outros entender a soma dos quadrados e maravilhoso. 

o 

o 

o 

o 

0 

8 

Eu gosto de condigoes de controle. 

o 

o 

0 

0 

0 

9 

Eu calculo tres ANOVAs de cabega antes de levantar da cama. 

o 

o 

0 

0 

0 

10 

Eu poderia passar o dia todo explicando estatistica para as pessoas. 

o 

o 

o 

0 

0 

11 

Gosto quando as pessoas me dizem que eu as ajudei a entender a rotagao dos 
fatores. 

o 

o 

0 

0 

0 

12 

As pessoas caem no sono no momento em que eu abro minha boca para falar. 

o 

o 

o 

0 

0 

13 

Projetos de experimentos sao divertidos. 

o 

o 

0 

0 

0 

14 

Eu prefiro pensar sobre variaveis dependentes apropriadas a ir ao bar. 

o 

o 

0 

0 

0 

15 

Eu me borro de medo com a simples mengao da analise dos fatores. 

o 

o 

o 

0 

0 

16 

Pensar sobre o uso ou nao de medidas repetidas ou independentes me excita. 

o 

o 

o 

0 

0 

17 

Adoro sentar no parque e meditar sobre o uso da observagao do participante 
no meu proximo experimento. 

o 

o 

o 

0 

0 

18 

Ficar na frente de 300 pessoas nao me causa ansiedade. 

o 

o 

o 

0 

0 

19 

Eu gosto de ajudar os alunos. 

o 

o 

o 

0 

0 

20 

Passar conhecimento adiante e o maior presente que voce pode dar a alguem. 

o 

o 

o 

o 

0 

21 

Pensar sobre as corregoes de Bonferroni me da um formigamento na virilha. 

o 

o 

0 

0 

0 

22 

Eu tremo de excitagao quando penso no meu proximo experimento. 

o 

o 

0 

0 

0 

23 

Eu geralmente passo o meu tempo livre falando com os pombos... e eles 
morrem de tedio. 

o 

o 

o 

0 

0 

24 

Eu tentei construir uma maquina do tempo para que pudesse voltar aos anos 

30 para seguir Fisher de joelhos e lamber o chao que ele pisasse. 

o 

o 

0 

0 

0 

25 

Eu adoro dar aula. 

o 

o 

o 

0 

0 

26 

Eu passo muito tempo ajudando os alunos. 

o 

o 

0 

0 

0 

27 

Eu adoro dar aula porque os alunos precisam fingir que gostam de mim para 
nao ganharem pessimas notas. 

o 

o 

o 

0 

0 

28 

Meu gato e meu unico amigo. 

o 

o 

0 

0 

0 


Figura 15.14 0 TOSSE-R (Teaching Of Statistics for Scientific Experiments-Revised). 







































16 

DADOS CATEGORICOS 


16.1 0 QUE VOCE VAIAPRENDER NESTE 
CAPITULO? © 

Finalmente o ultimo capftulo! Do meu 
ponto de vista, guardei o pior para o fim por- 
que raramente coleciono dados categoricos, 
desse modo, sei pouco sobre como analisa- 
-los! Mas, a completa ausencia de conheci- 
mento sobre um topico nunca me impediu de 
escrever sobre ele no passado. Algumas vezes, 
nao estamos interessados em testar escores 
ou medidas continuas, mas sim varidveis ca- 
tegoricas. Essas sao o que ate agora denomi- 
namos variaveis de grupo. Elas sao variaveis 
que descrevem categorias de entidades. Vimos 
esse tipo de variavel praticamente em todos os 
capftulos deste livro. Existem tipos diferentes 
de variaveis categoricas (veja a Segao 4.5.6), 
mas teoricamente uma pessoa ou caso deve 
estar em apenas uma categoria. Bons exem- 
plos de variaveis categoricas sao genero (com 
poucas exce^oes, as pessoas podem ser bio- 
logicamente somente homens ou mulheres) 1 , 
gravidez (uma mulher pode estar gravida ou 


1 Antes que alguem proteste, sei que existem cromosso- 
mos e condigdes hormonais que complicam a questao. 
Tambem, as pessoas podem ter diferentes idenddades 
de genero. 


nao) e votar numa eleigao (como regra geral, 
e permitido votar em um linico candidato). 
Em todos os casos (exceto na regressao lo- 
gfstica), ate agora usamos tais variaveis para 
prever algum tipo de resultado continuo, mas 
as vezes queremos verificar os relacionamen- 
tos entre diversas variaveis categoricas. Este 
capftulo trata de duas tecnicas para fazer isso. 
Comecamos com o caso simples de duas va¬ 
riaveis categoricas e descobrimos a estatfsti- 
ca qui-quadrado (a qual nao estamos, de fato, 
descobrindo porque inconscientemente vimos 
ela varias vezes antes). Depois, estendemos o 
modelo para verificar os relacionamentos en¬ 
tre diversas variaveis categoricas. 

16.2 TEORIA DA ANALISE DE DADOS 
CATEGORICOS © 

Vamos comegar este capftulo olhando 
para a situagao mais simples que podemos 
encontrar: isto e, analisar duas variaveis cate¬ 
goricas. Se quisermos olhar o relacionamento 
entre duas variaveis categoricas, nao podemos 
usar a media ou qualquer estatfstica similar 
porque nao temos qualquer variavel que tenha 
sido medida de modo contfnuo. Nao faz sen- 
tido tentar calcular a media de uma variavel 
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categorica porque os valores numericos que 
anexamos para categorias diferentes sao arbi- 
trarios e a media daqueles valores numericos 
dependera de quantos membros cada catego- 
ria tern. Portanto, quando medimos somente 
variaveis categoricas, analisamos frequencias. 
Isto e, analisamos o numero de fatores que se 
encaixam em cada categoria. Como exemplo, 
um pesquisador estava interessado se animais 
poderiam ser treinados para dancar em I inha . 
Ele pegou 200 gatos e tentou treina-los para 
dancar dando a eles comida ou afeto como 
recompensa para o comportamento desejado. 
No final da semana, ele contou quantos ani¬ 
mais podiam dangar e quantos nao. Existem 
duas variaveis categoricas: training (treina- 
mento) (o animal foi treinado usando ou co¬ 
mida ou afeigao, nao ambos) e dance (danga) 
(ele aprendeu a dancar ou nao). Combinando 
as categorias, ficamos com quatro catego¬ 
rias diferentes. Tudo o que precisamos fazer 
e contar quantos gatos caem dentro de cada 
categoria. Podemos tabular essas frequencias 
como na Tabela 16.1 (que mostra os dados 
para esse exemplo), conhecida como tabela 
de contingencia. 

16.2.1 Teste qui-quadrado de Pearson © 

Se queremos ver se existe um relaciona- 
mento entre duas variaveis categoricas (isto 
e, a quantidade de gatos que dancam esta re- 
lacionada ao tipo de treinamento usado?) po¬ 
demos usar o teste qui-quadrado de Pearson. 
Ele e uma estatistica extremamente elegante 
baseada na ideia simples de comparar frequen- 


* N. de T.: Danga tfpica em que os dangarinos ficam po- 
sicionados em uma ou mais linhas paralelas. 


cias que voce observou em certas categorias 
com as frequencias que voce espera conseguir 
nessas categorias por acaso. Voltando ao Ca- 
pftulo 1, 5 e 8, vimos que se ajustarmos um 
modelo a qualquer conjunto de dados, pode¬ 
mos avaliar esse modelo usando uma equacao 
muito simples (ou alguma variante dela): 

desvio = modelo - observado) 2 


Essa equagao foi a base para nossas so- 
mas de quadrados em regressao e ANOVA. 
Podemos usar a mesma equagao quando te- 
mos dados categoricos. Existe uma pequena 
variagao que consiste em dividir os desvios ao 
quadrado pelos escores do modelo, o que e o 
mesmo processo que dividir a soma dos qua¬ 
drados pelos graus de liberdade na ANOVA. A 
estatistica resultante e o qui-quadrado de Pe¬ 
arson (y 2 ) e e dada a equagao (16.1): 


x 2 =£ 


(Observadoy — Modelo,/) 2 
Modelo,j 


(16.1) 


Os dados observados sao, obviamente, as 
frequencias na Tabela 16.1, mas precisamos 
saber em que consiste o modelo nesse caso. 
Na ANOVA, o modelo que usamos e a media 
dos grupos, mas mencionei que nao podemos 
trabalhar com medias quando temos variaveis 
categoricas, portanto, usamos “valores espe- 
rados”. Uma maneira de estimar os valores 
esperados seria dizer “bem, se temos 200 
gatos no total e quatro categorias, os valores 
esperados sao simplesmente 200/4 = 50’. 
Isso seria correto se, por exemplo, tivessemos 
o mesmo numero de gatos que receberam 
afeigao como recompensa e comida como 
recompensa, mas isso nao ocorreu: 38 ganha- 


Tabela 16.1 Tabela de contingencia mostrando quantos gatos irao dangar depois de serem 
treinados com tipos diferentes de premios 
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ram comida e 162 ganharam afeto como re- 
compensa. Da mesma forma, os numeros dos 
que podem ou nao dancar nao sao os mesmos. 
Para levar isso em consideragao, calculamos 
os valores esperados para cada uma das celu- 
las da tabela (nesse caso, quatro celulas) utili- 
zando os totais das linhas e colunas para uma 
celula em particular a fim de calcular o valor 
esperado. Assim: 


Modelo*,- = E t j = 


Total da Total da 
Linha* x Colima, 

n 


2 _ (28-14,44) 2 (10 — 23,56) 2 

14,44 23,56 

| (48 —61,56) 2 | (114 —100,44) 2 
61,56 100,44 

_ (13,56) 2 (—13,56) 2 (—13,568) 2 

14,44 + 23,56 61,56 

| (13,56) 2 
+ 100,44 

= 12,73 + 7,80 + 2,99 + 1,83 
= 25,35 


n e simplesmente o numero total de ob- 
servagoes (nesse caso, 200). Podemos calcular 
esses valores esperados para as quatro celulas 
da nossa tabela (o total das linhas e o total das 
colunas sao abreviados por TL e TC, respec- 
tivamente): 


ModelOcomida, Sim 


ModelOcomida, Nao 


ModelOAfeao. Sim 


N4odclo Afei? ao, Nao 


TLsim X TCcomida 


76x38 


: 14,44 


200 

TL \a 0 X TCcomida 


23,56 


n 

124x38 
200 

TLsim x TC ; .\i e i(,ao 

76x162 61,56 


200 

TLnSo X TCAfei^ao 
124Xl6 ” 2 = 100,44 


200 


Dado que agora temos esses valores do 
modelo, tudo o que precisamos fazer e pegar 
cada valor em cada celula dos dados da nossa 
tabela, subtrair dele o valor correspondente do 
modelo, elevar o resultado ao quadrado e, en- 
tao, dividir pelo valor correspondente do mo¬ 
delo. Uma vez que voce tenha feito isso para 
cada celula da tabela, some os resultados. 


Esta estatfstica pode ser avaliada utilizando 
uma distribuigao x 2 com propriedades conheci- 
das. Tudo o que precisamos saber e o grau de li- 
berdade e ele e calculado como ( r- l)(c -1), onde 
reo numero de linhas eceo numero de colunas. 
Outra maneira de calcular o grau de liberdade e 
pensar no numero de nfveis de cada variavel me- 
nos 1 multiplicados entre si. Nesse caso, temos 
(2 — 1)(2 — 1) = 1 gl. Se voce estivesse fazendo 
o teste manualmente, encontraria um valor crfti- 
co para a distribuigao qui-quadrado com 1 gl e se 
o valor observado fosse maior do que esse valor 
crftico, voce diria que houve um relacionamen- 
to significativo entre as duas variaveis. Esses 
valores crfticos sao apresentados no Apendice 
A4; para 1 gl os valores crfticos sao 3,84 (para 
p = 0,05) e 6,63 (para p = 0,01) e, assim, como 
o qui-quadrado calculado e maior do que esses 
valores, ele e significativo ao nivel p < 0,01. En- 
tretanto, se voce usar o SPSS, ele simplesmente 
produzira uma estimativa da probabilidade exata 
de obter um valor qui-quadrado tao grande quan¬ 
to esse (no caso, 25,35) apenas por acaso. 

16.2.2 A razao de verossimilhanga © 

Uma alternativa para o qui-quadrado de 
Pearson e a estatfstica da razao de verossi- 
milhanga, que e baseada na teoria de maxima 
verossimilhanga. A ideia geral por tras dessa 
teoria e que voce coleta alguns dados e cria um 
modelo para o qual a probabilidade de obter o 
conjunto de dados observados e maximizada 
e, entao, compara esse modelo a probabilida- 
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de de obter aqueles dados sob a hipotese nula. 
A estatistica resultante e, portanto, baseada na 
comparagao das frequences observadas com 
as previstas pelo modelo: 

L x » = 2EO^™do il „(^2t) (16.2) 


onde In e o logaritmo natural (essa e uma 
fungao padrao matematica que encontramos 
no Capitulo 6; voce pode encontra-la na sua 
calculadora como In ou log e ). Usando o mes- 
mo modelo e os valores observados como na 
segao anterior, isso nos daria: 


L X 


28xln 


+48 x In 


28 
14,44/ 
48 


x In 


g61,56 
114 


|+10xln 


114 


10 

23,56 


( 100 , 44 ; 

= 2[(28 x 0,662) + (10 x -0,857) 
+(48 x -0,249) + (114 x 0,127)] 
= 2[18,54 - 8,57 -11,94 +14,44] 
= 24,94 


nos (em outras palavras, ela tende a cometer 
o erro Tipo I). Portanto, Yates sugeriu uma 
corregao para a formula de Pearson (geral- 
mente chamada de corregcio de continuidade 
de Yates). A ideia basica e que quando voce 
calcula os desvios do modelo (os valores Ob- 
servadoj- Modelo^ na equagao (16.1)), sub- 
trai 0,5 do valor absoluto desse desvio antes 
de eleva-lo ao quadrado. Simplificando, isso 
significa que voce calcula o desvio, ignora se 
ele e positivo ou negativo, subtrai 0,5 desse 
desvio e entao eleva-o ao quadrado. A equa¬ 
gao de Pearson, nesse caso, fica: 

2 y-i (|Observado,) — Modelo,)-1 — 0,5) 2 

X ^ Modelo,) 

Para os dados do nosso exemplo, isso se 
traduz em: 

2 (13,56-0,5) 2 (13,56-0,5) 2 

X 14,44 23,56 

(13,56 —0,5) 2 (13,56-0,5) 2 

61,56 100,44 

= 11,81 + 7,24+2,77 + 1,70 
= 23,52 


Como o qui-quadrado de Pearson, essa 
estatistica tern uma distribuigao qui-quadrada 
com os mesmos graus de liberdade (nesse caso, 
1). Assim, ele e testado da mesma forma: isto e, 
podemos olhar o valor critico do qui-quadrado 
para o numero de graus de liberdade que temos. 
Como antes, o valor que temos aqui sera signi¬ 
ficative porque ele e maior do que os valores 
criticos de 3,84 (para p = 0,05) e 6,63 (para p 
= 0,01). Para amostras maiores, essa estatistica 
sera grosseiramente a mesma que o qui-quadra¬ 
do de Pearson, mas ela e preferivel quando as 
amostras sao pequenas. 

16.2.3 Corregao de Yates © 

Quando voce tem uma tabela de contin- 
gencia 2x2 (isto e, duas variaveis catego- 
ricas onde cada uma tem duas categorias), 
o qui-quadrado de Pearson tende a produzir 
valores significativos que sao muito peque- 


Uma coisa importante a ser notada e que 
ele baixa o valor da estatistica do qui-quadra¬ 
do e, portanto, a torna menos significativa. 
Embora parega uma boa solugao para o pro- 
blema, existem evidencias que isso corrige 
demais e produz valores do qui-quadrados 
muito menores! Howell (2002) fornece uma 
excelente discussao sobre o problema com a 
corregao de continuidade de Yates, se voce 
estiver interessado; tudo o que direi e que em¬ 
bora valha a pena saber sobre isso, provavel- 
mente e melhor ignorar! 

16.3 HIP0TESES DO TESTE 
QUI-QUADRADO (!) 

Deveria ser obvio que o teste do qui-qua¬ 
drado nao se baseia em hipoteses como ter da¬ 
dos continuos normalmente distribuidos como 
a maioria dos outros testes neste livro (dados 
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categoricos nao podem ser normalmente dis- 
tribufdos porque eles nao sao contfnuos). En- 
tretanto, o teste do qui-quadrado tem duas hi- 
poteses importantes: 

1. Para o teste ser significativo e imperativo 
que cada pessoa, item ou entidade contri- 
buam para somente uma celula da tabela de 
contingencia. Portanto, voce nao pode usar 
o teste do qui-quadrado num modelo de me- 
didas repetidas (por exemplo, se tivessemos 
treinado alguns gatos com comida para ver 
se dancariam e, entao, treinado os mesmos 
gatos com afeto para ver se dancariam, nao 
podenamos analisar os dados resultantes 
com o teste do qui-quadrado de Pearson). 

2. O segundo ponto importante e que as fre¬ 
quencias esperadas devem ser maiores do 
que 5 em cada celula; embora seja aceita- 
vel que grandes tabelas de contingencias 
tenham ate 20% de frequencias esperadas 
abaixo de 5%, o resultado e uma perda de 
poder estatfstico (assim, o teste pode fa- 
lhar em detectar um efeito genuino). Mes- 
mo em grandes tabelas de contingencia, 
frequencias esperadas nao devem ficar 
abaixo de 1. Howell (2002) fornece uma 
boa explicagao de por que a violagao des- 
sa hipotese cria problemas. 

Finalmente, embora nao seja uma hipotese, 
e adequado mencionar que proporcionalmente 
pequenas diferengas em frequencias nas celulas 
podem resultar em associates estatisticamen- 
te significativas entre duas variaveis. Portanto, 
precisamos olhar as percentagens das linhas e 
colunas para interpretar qualquer efeito obtido. 
Essas percentagens refletirao os padroes dos da¬ 
dos bem melhor do que as proprias frequencias 
(porque as frequencias dependerao do tamanho 
da amostra nas diferentes categorias). 

16.4 REALIZANDO 0 TESTE DO 
QUI-QUADRADO NO SPSS 0 

Existem duas maneiras nas quais dados 
categoricos podem ser fornecidos ao software ; 
entrar com os escores brutos ou entrar com ca- 
sos ponderados. Veremos as duas formas. 


16.4.1 Entrando com os dados: escores 
brutos © 

Entrar com os dados brutos significa que 
cada linha do editor de dados representa cada 
entidade das quais temos dados (nesse exem¬ 
plo, cada linha representa um gato). Assim, 
voce deveria criar duas variaveis codificadas 
training e dance (treino e danca) e especift- 
car codigos numericos apropriados para cada 
uma. O training poderia ser codificado com 0 
para representar a recompensa com comida e 1 
para representar afeto, e dance poderia ser co¬ 
dificado com 0 para representar um animal que 
dancou e 1 para um que nao dancou. Para cada 
animal, voce coloca o codigo numerico apro- 
priado em cada coluna. Assim, um gato que foi 
treinado com comida e nao dangou teria 0 na 
coluna do treinamento e 1 na coluna da danga. 
Os dados no arquivo Cats.sav estao apresen- 
tados dessa maneira e voce devera ser capaz 
de identificar as variaveis descritas. Havia 200 
gatos no total, assim, ha 200 linhas de dados. 

16.4.2 Entrando com os dados: 
ponderando casos 0 

Um metodo alternative para a entrada dos 
dados e criar as mesmas variaveis codificadas 
de antes, mas ter uma terceira variavel que re¬ 
presenta o numero de animais que estao em 
cada combi nagao de categorias. Em outras 
palavras, entramos os dados das frequencias 
(o numero de casos de cada categoria). Pode- 
mos chamar essa variavel de frequent. A Fi- 
gura 16.1 mostra o editor de dados com essa 
terceira variavel adicionada. Agora, em vez de 
ter 200 linhas, cada uma representa um ani¬ 
mal diferente, temos uma linha representando 
cada combinagao de categorias e uma variavel 
mostrando quantos animais estao nessa com- 
binagao de categorias. Assim, a primeira linha 
representa gatos que tiveram comida como re¬ 
compensa e dangaram. A variavel frequente 
mostra 28 gatos nessa situagao. A informagao 
foi previamente representada por 28 linhas 
diferentes no arquivo Cats.sav e, assim, voce 
pode ver que esse metodo de entrada de dados 
poupa muito tempo! Estendendo esse princf- 
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Figura 16.1 Entrada de dados usando casos ponderados. 


pio, podemos ver que quando o afeto foi usado 
como recompensa, 114 gatos nao dangaram. 

Entrar dados usando uma variavel repre- 
sentando o numero de casos que estao numa 
combinagao de categorias pode economizar 
muito tempo. Entretanto, para analisar dados 
dessa maneira precisamos dizer ao compu- 
tador que a variavel frequente representa o 
numero de casos que estao numa combinagao 
particular de categorias. Para fazer isso, aces- 
se a fungao casos ponderados usando o menu 
Data=>Weight Cases... (Dados=>Ponderar 
Casos...) para acessar uma caixa de dialogo 
semelhante a da Figura 16.2. Selecione a op- 
gao Weight cases (Ponderar Casos) e depois 
selecione a variavel que representa o nume¬ 
ro casos (nesse caso, frequent) e transfira-a 
para o quadro Frequency Variable (Variavel 


Frequencia) clicando em _lI. Esse processo 
informa ao computador que ele deve ponderar 
cada combinagao de categorias pelo numero 
na coluna frequent. Portanto, o computador 
ira fingir, por exemplo, que ha 28 linhas de 
dados que tern a combinagao de categoria 0, 
0 (representando gatos treinados com comida 
que dangaram). Os dados que entraram dessa 
maneira estao no arquivo CatsWeight.sav, e 
se voce usar esse arquivo lembre-se de ponde¬ 
rar os casos como foi descrito. 

16.4.3 Executando a analise ® 

Resumir dados em categorias e feito usan¬ 
do o comando crosstabs (tabulagao cruzada) 
(que tambem produz o teste do qui-quadrado). 
O crosstabs esta no menu Descriptive Statis- 



Figura 16.2 A caixa de dialogo para o comando weight cases (ponderar casos). 
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tics (Estatistica Descritiva) (Analyze=>Des- 
criptive Statistics=>Crosstabs...) 

(Analisar=>Estatfstica Descritiva=>Tabulagao 
Cruzada). A Figura 16.3 mostra as varias 
caixas de dialogo para o comando crosstabs 
(tabulagao cruzada) (a variavel frequent esta 
no diagrama porque executei a analise nos 
dados do arquivo Cats Weigh t.sav). Primei- 
ro, entre com uma das variaveis de interesse 
no quadro Row(s) (linha(s)) marcando-a no 
lado esquerdo e transfira-a clicando em LlJ. 
Para esse exemplo, selecionei dance (danga) 
para ser representada como linhas na tabela. 
A seguir, selecione a outra variavel de interes¬ 
se, training (treinamento), e transfira-a para 
o quadro Column(s) (Colunas) clicando em 
jJ. Alem disso, e possfvel selecionar uma va¬ 
riavel camada (isto e, voce pode dividir as li¬ 
nhas de uma tabela em categorias adicionais). 
Se voce tiver uma terceira variavel categorica 
(como teremos mais tarde neste capitulo), po- 
dera dividir a tabela de contingencia por essa 
variavel (assim, a camada da tabela representa 
diferentes categorias dessa terceira variavel). 

Se voce clicar em »*••«. (Estatfsticas), 
uma caixa de dialogo aparece em que voce 
pode especificar varios testes estatfsticos. As 


opcoes mais importantes do menu estatfsti- 
cas para dados categoricos estao descritas no 
Quadro 16.1. 

Selecione o teste do qui-quadrado, a cor- 
regao de continuidade, fi e lambda e, depois, 
clique em c »—» (Continuar). Se voce clicar em 
ceiis... (Celulas), uma caixa de dialogo apa¬ 
rece na qual voce pode especificar o tipo de 
dados exibidos na tabela de tabulagao cruza¬ 
da. E importante voce solicitar as frequencias 
esperadas porque, para que o qui-quadrado 
seja preciso, os valores esperados devem ser 
maiores do que certos limites. A regra basica e 
que em tabelas de contingencia 2x2 nenhum 
valor esperado deve ficar abaixo de 5. Em ta¬ 
belas maiores, a regra e que todos os valores 
esperados devem ser maiores do que 1, e nao 
mais do que 20% das frequencias esperadas 
podem ser menores do que 5. E util, tambem, 
olhar a linha, coluna e o total percentual por¬ 
que esses valores sao normalmente mais fa- 
ceis de interpretar do que as frequencias reais 
e eles fornecem uma ideia da origem de qual- 
quer efeito significativo. Depois de selecionar 
essas opcoes, clique em ... (Continuar) para 
retornar a caixa de dialogo principal. Clique 
em I &acl - I (Exato) (se voce tem os testes exa- 


Quadro 16.1 


Opgoes estatfsticas para tabulagoes cruzadas 

• Qui-quadrado ( Chi-Square ): Ele executa o teste basico do qui-quadrado de Pearson (Segao 
16.2.1). 0 teste do qui-quadrado detecta se existe uma associagao significativa entre duas va¬ 
riaveis categoricas. Entretanto, ele nao diz nada sobre quao forte essa associagao pode ser. 

• Fi e o V de Cramer (Phi and Cramer's l/): Essas sao medidas do grau de associagao entre 
duas variaveis categoricas. 0 Fi e usado com tabelas de contingencia 2x2 (tabelas em 
que voce tem duas variaveis categoricas e cada variavel tem somente duas categorias). 
0 Fi e calculado dividindo o valor do qui-quadrado pelo tamanho da amostra e, entao, 
tirando a raiz quadrada desse resultado. Se uma das duas variaveis categoricas apresenta 
mais do que duas categorias, o V de Cramer e mais adequado do que o Fi, porque o Fi nao 
alcanga o valor minimo de zero (indicando nenhuma associagao) nesses casos. 

• Lambda (Lambda): O X de Goodman e Kruskal mede a redugao proporcional no erro 
obtida quando uma variavel e utilizada para prever outra variavel. Um valor de 1 significa 
que uma variavel preve perfeitamente a outra, e um valor de 0 indica que uma variavel de 
maneira nenhuma preve a outra. 

• A estatistica de Kendall (Kendall's statistic ): Essa estatistica e discutida na Segao 4.5.5. 
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Figura 16.3 Caixa de dialogo para o comando crosstabs (tabulagoes cruzadas). 


tos instalados). Expliquei essa opgao na Segao 
13.2.3, assim, nao vou insistir nela aqui, mas 
selecione a opgao teste Exato. Clique em 
(Continue) para retornar a caixa de dialogo 
principal e, entao, clique em °« para efetuar 
a analise. 

16.4.4 Saida para o teste 
qui-quadrado © 

A tabela de tabulagao cruzada produzida 
pelo SPSS (Saida 16.1 do SPSS) apresenta 
o numero de casos que se encaixam em cada 
combinagao de categorias e e muito parecida 
com nossa tabela de contingencia original. 
Podemos ver que no total 76 gatos dangaram 
(38% do total) e, desses, 28 foram treinados 


usando comida (36,8% dos que dangaram) e 
48 foram treinados com afeto (63,2% dos que 
dangaram). Cento e vinte e quatro gatos nao 
dangaram (62% do total) e daqueles que nao 
dangaram 10 foram treinados usando comida 
como recompensa (8,1% dos que nao dan¬ 
garam) e 114 foram treinados usando afeto 
(91,9% dos que nao dangaram). O numero de 
gatos pode ser lido nas linhas denominadas 
Count (Contagem) e a percentagem pode ser 
lida nas linhas denominadas % within Did they 
dance? (% dentro de Eles dangaram?). Pode¬ 
mos, tambem, verificar as percentagens dentro 
das categorias de treinamento olhando para as 
linhas chamadas de % within Type of Training 
(% dentro do Tipo de Treinamento). Isso nos 
informa, por exemplo, que daqueles treinados 
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Saida 16.1 do SPSS 

Did they dance? Type of Training Crosstabulation (Eles dangaram? 
Tabulagao cruzada do tipo de Treinamento) 





Type of Training (Tipo de Treinamento) 





Food as Reward 

Affection as 





(Comida como 

Reward (Afeto como 





recompensa) 

recompensa) 

Total 

Did they 

Yes 

Count (Contagem) 

28 

48 

76 

dance? 

(Sim) 

Expected Count (Contagem Esperada) 

14.4 

61.6 

76.0 

(Eles dan- 


% within Did they dance? (% dentro de 

36.8% 

63.2% 

100.0% 

garam?) 


Eles dangaram?) 

% within Type of Training (% dentro do 
Tipo de Treinamento) 

73.7% 

29.6% 

38.0% 



% of total (% do total) 

14.0% 

24.0% 

38.0% 


No 

Count (Contagem) 

10 

114 

124 


(Nao) 

Expected Count (Contagem Esperada) 

23.6 

100.4 

124.0 



% within Did they dance? (% dentro de 

8.1% 

91.9% 

100.0% 



Eles dangaram?) 

% within Type of Training (% dentro do 
Tipo de Treinamento) 

26.3% 

70.4% 

62.0% 



% of total (% do total) 

5.0% 

57.0% 

62.0% 

Total 


Count (Contagem) 

38 

162 

200 



Expected Count (Contagem Esperada) 

38.0 

162.0 

200.0 



% within Did they dance? (% dentro de 

19.0% 

81.0% 

100.0% 



Eles dangaram?) 

% within Type of Training (% dentro do 
Tipo de Treinamento) 

100.0% 

100.0% 

100.0% 



% of total (% do total) 

19.0% 

81.0% 

100.0% 


com comida como recompensa, 73,7% dan¬ 
garam e 26,3% nao dancaram. Similarmente, 
para aqueles treinados com afeto, somente 
29,6% dangaram comparado com 70,4% que 
nao dancaram. Resumindo, quando a comida 
foi usada como recompensa, a maioria dos ga- 
tos dangcu, mas quando o afeto foi usado, a 
maioria dos gatos se recusou a dangar. 

Antes de vermos o teste estatistico pro- 
priamente dito, e vital checarmos se a hipote- 
se do qui-quadrado foi satisfeita. A hipotese e 
que nas tabelas 2x2 (que temos aqui) todas 
as frequences esperadas devem ser maiores 
do que 5. Se voce olhar para as contagens es¬ 
peradas na tabela de tabulagao cruzada (que 
casualmente e a mesma que calculamos antes), 
deve ficar claro que a menor contagem espera- 
da e 14,4 (para gatos que foram treinados com 
comida e dancaram). Esse valor e bem maior 
do que 5 e, assim, a hipotese esta satisfeita. Se 
voce encontrar uma contagem esperada mais 
baixa do que 5, o melhor seria coletar mais 


dados e tentar aumentar a proporgao de casos 
em cada categoria. 

Como vimos antes, o teste qui-quadrado 
de Pearson examina se existe uma associa- 
gao entre variaveis categoricas (nesse caso, o 
tipo de treinamento e se o animal dangou ou 
nao). Como parte do procedimento das tabu¬ 
lates cruzadas, o SPSS produz uma tabela 
(Saida 16.2 do SPSS) que inclui a estatistica 
qui-quadrado e sua significancia. A estatistica 
qui-quadrado testa se as duas variaveis sao de- 
pendentes. Se o valor de significancia e peque- 
no o suficiente (por convengao, a significancia 
deve ser menor do que 0,05), rejeitamos a hi¬ 
potese de que as variaveis sao independentes 
e aceitamos a hipotese de que elas estao de 
alguma maneira relacionadas. O valor da esta¬ 
tistica qui-quadrado (e os graus de liberdade) 
e dado na tabela assim como o valor de signi¬ 
ficancia. O valor da estatistica qui-quadrado 
e 25,356, a qual, a menos que haja um erro 
de arredondamento, e o valor que calculamos 
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Saida 16.2 do SPSS 

Qui-Square Tests (Testes Qui-quadrado) 






Exact Sig. 

Exact Sig. 


Value 

df 

Asymp. Sig. 

(2-sided) (Sig. 

(1-sided) (Sig. 


(Valor) 

(gi) 

(Sig. Assintotica) 

Exata - Bilateral) 

Exata Unilateral) 

Pearson Chi-Square (Qui-quadra- 

25.356 b 

1 

0.000 



do de Pearson) 

Continuity Correction 3 (Corregao 
de continuidade) 

23.520 

1 

0.000 



Liieiihood Ratio (Razao de veros- 
similhanga) 

Fisher's Exact Test (Teste Exato 

24.932 

1 

0.000 

0.000 

0.000 

de Fisher) 

Linear-by-Linear Association (As- 

25.229 

1 

0.000 



sociagao Linear-por-Linear) 

N of Valid Cases (Casos Validos) 

200 






a Computed only for 2 x 2 table (Calculado somente para tabelas 2x2) 

b. 0 cells (.0%) have expected count less than 5. (0 celulas (0%) tem valor esperado menor do que 5) 


na Sec an 16.2.1. Esse valor e altamente signi¬ 
ficative (p < 0,001), indicando que o tipo de 
treinamento usado teve um efeito significativo 
em se o animal dangaria ou nao. 

Uma serie de outras estatfsticas tambem 
esta incluida na tabela (muitas delas foram es- 
pecialmente solicitadas usando as opgoes de 
uma caixa de dialogo semelhante a da Figu- 
ra 16.3). Continuity Correction (Corregao de 
Continuidade) e o qui-quadrado com a cor¬ 
regao de Yates (veja a Segao 16.2.3) e o seu 
valor e o mesmo que o valor calculado ante- 
riormente (23,52). Como mencionei antes, e 
melhor ignorar esse teste, mas ele confirma o 
resultado do teste principal do qui-quadrado. 
A Likelihood Ratio (razao de verossimilhan- 
ga) e a estatistica que encontramos na Segao 
16.2.2 (e, a menos que haja um erro de ar- 
redondamento, e o valor que ja calculamos: 
24,93). Novamente, isso confirma o resultado 
do qui-quadrado principal, mas essa estatisti¬ 
ca e preferfvel em amostras menores. 

Embaixo da tabela do qui-quadrado ha 
algumas notas de rodape relacionadas a hipo- 
tese de que as frequencias esperadas devem 
ser maiores do que 5. Se voce esqueceu de ve- 
rificar essas suposigoes, o SPSS fornece um 
resumo das contagens esperadas abaixo de 5. 
Nesse caso, nao ha frequencias esperadas me¬ 
nores do que 5, assim, sabemos que a estatisti¬ 
ca qui-quadrado e precisa. 


O resultado altamen¬ 
te significativo indica que 
existe uma associagao en- 
tre o tipo de treinamento e 
se o gato dangou ou nao. 

O que queremos dizer por 
associagao e que o padrao 
das respostas (isto e, a pro- 
porgao de gatos que dan- 
garam para a proporgao de 
gatos que nao dangaram) 
nas duas condigoes de treinamento e signi- 
ficantemente diferente. O achado significa¬ 
tivo reflete no fato de que quando a comida 
e usada como recompensa, em torno de 74% 
dos gatos aprenderam a dangar e 26% nao, 
enquanto o afeto e usado, o contrario e verda- 
deiro (em torno de 70% se recusou a dangar e 
30% dangaram). Portanto, podemos concluir 
que o tipo de treinamento usado influenciou 
significativamente o comportamento dos ga¬ 
tos: eles dangarao por comida, mas nao por 
amor! Tendo vivido com um adoravel gato 
por muitos anos, isso sustenta minha visao 
cetica de que os gatos nada farao a nao ser 
que tenham um pote de comida esperando por 
eles! 

Se solicitado, o SPSS produzira outra ta¬ 
bela de saida contendo alguns testes estatisti- 
cos adicionais. Muitos desses testes sao medi- 
das do grau da associagao. Essas medidas sao 
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baseadas na estatfstica qui-quadrado modifi- 
cada levando em considerate) o tamanho da 
amostra e os graus de liberdade, e elas tentam 
restringir a escala da estatfstica teste ao inter- 
valo de 0 a 1 (para torna-las similares ao coe- 
ficiente de correlacao descrito no Capftulo 4). 
Elas sao mostradas na Safda 16.3 do SPSS. 

• Fi (Phi): Essa estatfstica e precisa para ta- 
belas de contingencia 2x2. Entretanto, 
para tabelas com mais do que duas dimen- 
soes, o valor de Fi pode nao estar entre 0 
e 1 porque o valor do qui-quadrado pode 
exceder ao tamanho da amostra. Por esse 
motivo, Pearson sugeriu o uso do coefi- 
ciente de contingencia. 

• O V de Cramer (Cramer’s V): Quando 
ambas as variaveis tern somente duas ca- 
tegorias, o Fi e o V de Cramer sao identi- 
cos. Entretanto, quando as variaveis tern 
mais do que duas categorias, a estatfstica 
de Cramer pode alcancar seu maximo de 
1 - diferente das outras duas - e, desse 
modo, ela e a mais util. 

• Coeficiente de contingencia (Contin¬ 
gency Coefficient): Esse coeficiente 
produz um valor entre 0 e 1, mas, infe- 
lizmente, ele raramente alcanna seu limite 
superior que e 1; por esse motivo, Cramer 
elaborou o coeficiente V. 

Para esses dados, a estatfstica de Cramer 
e 0,36 de um maximo possfvel de 1. Isso re- 
presenta uma associagao media entre o tipo 
de treinamento e se os gatos dancaram ou nao 
(se voce pensar em termos de coeficiente de 
correlacao, isso representa um tamanho de 


efeito medio). Esse valor e altamente signi- 
ficativo (p < 0,001), indicando que um valor 
da estatfstica teste desse tamanho dificilmente 
ocorreu por acaso e, portanto, a forga do re- 
lacionamento e significativa. Esses resultados 
confirmam o que o teste qui-quadrado j a havia 
demonstrado, mas tambem nos fornece uma 
ideia do tamanho de efeito. 

16.4.5 Calculando o tamanho 
de efeito © 

Embora o V de Cramer seja um tamanho 
de efeito adequado (no sentido de que ele esta 
restrito entre 0 e 1 e e, portanto, de facil in- 
terpretagao), a mais comum e, possivelmen- 
te, a mais util medida do tamanho de efeito 
para dados categoricos e o risco relativo. Os 
riscos relativos sao particularmente Lite is em 
tabelas de contingencia 2x2 porque para 
essas tabelas a interpretagao do risco relativo 
e muito clara. Entretanto, isso nao e tao res- 
tritivo quanto voce poderia pensar porque, 
como relatei nos capftulos MLG, os tamanhos 
de efeito sao somente uteis quando eles resu- 
mem uma comparagao especffica. Uma tabela 
de contingencia 2x2 sao dados categoricos 
equivalentes a uma comparagao especffica! 

O risco relativo e simples o suficiente 
para poder ser calculado. Se pegarmos nosso 
exemplo, podemos calcular primeiro a chance 
de um gato dangar dado que ele teve comida 
como recompensa. Isso e simplesmente o nu- 
mero de gatos para os quais comida foi for- 
necida e que dangaram, dividido pelo numero 


Saida 16.3 do SPSS 


Symmetric Measures (Medidas simetricas) 



Value 

(Valor) 

Asymp. Sig. 

(Sig. Assintotica) 

Nominal by Nominal (Nominal 

Phi (Fi) 

0.356 

0.000 

versus Nominal) 

Cramer's V (V de Cramer) 

0.356 

0.000 


Contingency Coefficient 

0.335 

0.000 


(Coeficiente de Contingencia) 



N of Valid Cases (Casos Validos) 


200 



a Nao assumindo a hipotese nula. 

b. Utilizando o erro padrao assintotico assumindo a hipotese nula. 
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de gatos para os quais comida foi dada e nao 
dancaram: 


Numero dos 
que comeram e 

nu c dancaram 

^nances danQar ap6s comida — —— ■ 

Numero dos 

que comeram 
e nao dancaram 
_ 28 
~To 
= 2,8 


Risco relativo = 


Chancei 


'Dangar apos comer 


ChanceDan^ar apos afeto 

2,8 


0,421 
= 6,65 


Isso nos informa que se um gato foi trei- 
nado com comida, ele teve 6,65 mais chance 
de dancar. E uma metrica extremamente ele¬ 
gante e de facil compreensao para expressar o 
efeito que voce conseguiu! 


Em seguida, calculamos a chance de um gato 
dangar dado que ele teve afeto como recompensa. 
Isso e simplesmente o numero de gatos que ga- 
nharam afeto e dangaram dividido pelo numero 
de gatos que ganharam afeto e nao dangaram: 

Numero dos que 
ganharam afeto 
e dancaram 

L.nances dan rarap6s afeto = : 

Numero dos que 

ganharam afeto 
e nao dancaram 

_ 48 
114 

= 0,421 

O risco relativo e simplesmente a chance 
de dancar apos comida dividida pela chance 
de dancar apos afeto: 


16.4.6 Relatando os resultados 
do qui-quadrado ® 

Quando relatamos o qui-quadrado de 
Pearson, simplesmente relatamos o valor da 
estatistica teste com seus graus de liberdades 
associados e o valor da significancia. A esta¬ 
tistica teste, como vimos, e representada por 
X 2 . A saida do SPSS nos informa que o valor 
de x 2 era de 25,36 e que os graus de liberdade 
nos quais ele foi baseado foram 1 e que ele 
era significativo com (p < 0,001). Tambem e 
util reproduzir a tabela de contingencia e ava- 
liar o risco relativo. Desse modo, podemos 
relatar: 

/ Houve uma associacao significativa entre o 
tipo de treinamento e se os gatos dangaram 
ou nao, x 2 (1) = 25,36, (p < 0,001). Isso 
parece representar o fato de que, baseado 


/ - ; - 

Dica da Samanta Ferrinho 





V. 


• Se voce quiser testar o relacionamento entre duas variaveis categoricas, pode 
faze-lo com o teste do qui-quadrado de Pearson ou a estatistica da razao de 
verossimilhanga. 

• Olhe para a tabela Testes qui-quadrado. Se o Valor da Significancia Exata e 
menor do que 0,05 para a linha do qui-quadrado de Pearson, existe um rela¬ 
cionamento significativo entre suas duas variaveis. 

• Verifique as notas da tabela para ter certeza de que frequences esperadas nao 
sao menores do 5. 

• Olhe para a tabela de tabulagao cruzada para saber qual e o relacionamento 
entre as variaveis - melhor ainda, calcule o risco relativo. 

• Relate a estatistica x 2 . os graus de liberdade e o valor da significancia. Tam¬ 
bem apresente a tabela de contingencia. 
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no risco relativo, os gatos tiveram 6,65 
mais chances de dangar se treinados com 
comida do que se treinados com afeto. 

16.5 DIVERSAS VARIAVEIS 
CATEGORICAS: ANALISE 
LOGLINEAR ® 


Yj — (b 0 + b + b 2 X 2 + ... + b lt X n ) + e, 

Tambem, quando apresentamos a ANO- 
VA de um fator, adaptamos esse modelo de 
regressao para conceitualizar nosso exemplo 
do Viagra como (veja a Equagao (8.2)): 

Libido, = b 0 + b 2 Alta, + £>,Baixa, + e, 


Ate agora vimos situagoes nas quais ha so- 
mente duas variaveis categoricas. Entretanto, 
geralmente queremos analisar tabelas de contin¬ 
gency mais complexas em que ha tres ou mais 
variaveis. Por exemplo, que tal se tomarmos o 
exemplo que acabamos de usar, mas tambem co- 
letarmos dados de uma amostra de 70 cachorros? 
Teremos agora tres variaveis: animal (animal) 
(cachorro ou gato), training (treinamento) (co¬ 
mida ou afeto como recompensa) e dance (dan- 
5 a) (eles dangaram ou nao?). Isso nao pode ser 
analisado com o qui-quadrado de Pearson, mas 
com uma tecnica chamada de andlise loglinear. 



16.5.1 Qui-quadrado como regressao © 

Para comecar, vamos ver 
como o nosso simples qui-qua¬ 
drado pode ser expresso na for¬ 
ma de um modelo de regressao. 
Embora ja saibamos o suficien- 
te sobre o teste qui-quadrado, para entender 
situagoes mais complexas, e mais simples con- 
siderar nosso modelo como um modelo linear 
geral (isto e, de regressao). Todos os modelos 
gerais lineares que consideramos neste livro 
tomam a forma geral de: 


O teste t foi concebido de maneira similar. 
Em todos os casos, a mesma equagao basica 
e usada, somente a complexidade do modelo 
muda. Com os dados categoricos, podemos usar 
o mesmo modelo da mesma maneira que usa- 
mos com a regressao para produzir um mode¬ 
lo linear. No nosso exemplo atual, temos duas 
variaveis categoricas: treinamento (comida ou 
afeto) e danga (sim, eles dangaram, ou nao, 
eles nao dangaram). As duas variaveis tem duas 
categorias cada e, assim, podemos representar 
cada uma com uma simples variavel auxiliar 
(dummy) (veja a Segao 5.10.1), em que uma 
categoria e codificada como 0 e a outra, como 
1. Assim, para treinamento podemos codificar 
“comida” como 0 e “afeto” como 1 , e podemos 
codificar a variavel danga como 0 para “sim” e 1 
para “nao” (veja a Tabela 16.2). 

Essa situagao pode parecer familiar se 
voce lembrar da ANOVA fatorial (Segao 10.8), 
na qual tambem tfnhamos duas variaveis pre- 
visoras. Naquela situagao, vimos que quando 
existem duas variaveis, o modelo linear geral 
torna-se (lembre da Equagao (10.1)): 


Saida, = (b 0 + b t A, + b 2 B, + £> 3 AB,) + e,- 


Saida, = (Modelo,) + erro, 

Por exemplo, quando apresentamos a regres¬ 
sao multipla no Capftulo 5, vimos que esse mo¬ 
delo estava escrito como (veja a Equagao (5.9)): 


em que A representa a primeira variavel, B 
representa a segunda variavel e AB representa 
a interagao entre as duas variaveis. Portanto, 
podemos construir um modelo linear usando 
essas variaveis auxiliares que sao exatamente 


Tabela 16.2 Esquema de codigos para os gatos dangantes 


Treinamento 

Danga 

Treino (Auxiliar) 

Danga (Auxiliar) 

Interagao 

Frequencia 

Comida 

Sim 

0 

0 

0 

28 

Comida 

Nao 

0 

1 

0 

10 

Afeto 

Sim 

1 

0 

0 

48 

Afeto 

Nao 

1 

1 

1 

114 
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as mesmas que utilizamos na ANOVA fatorial 
(acima). O termo de interagao sera, simples- 
mente, a variavel treinamento multiplicada pela 
variavel danga (veja a Tabela 16.2 e, se nao fi- 
zer sentido, retorne a Segao 10.8, pois o codigo 
e exatamente o mesmo desse exemplo): 

Salda, = (Modelo,) + erro, 

Salda,•, = (b Q + ^Treinamento,- 

+ /xDanga, + ^Interagao,,) + e tj (16.3) 

No entanto, em virtude de estarmos usando 
dados categoricos, para tornar o modelo linear 
temos que trabalhar com o logaritmo (veja o 
Capftulo 6 ) e, assim, o modelo real se torna : 2 

ln(Oi) = ln(Modelo,) + ln(e,) 
lnlOQ = ( b 0 + fojTreinamento, 

+ /xDanga ( + fojlnteragao,-,) 

+ ln(£y) (16.4) 

As variaveis treinamento e danga e a inte¬ 
ragao podem ter os valores 0 e 1 dependendo de 
qual combinagao de categorias estamos olhan- 
do (Tabela 16.2). Portanto, para saber o que os 
valores b representam nesse modelo, podemos 
fazer o mesmo que foi feito para o teste tea 
ANOVA e ver o que acontece quando trocamos 
treinamento e danga pelos valores de 0 e 1. Para 
comegar, vamos ver o que acontece quando 
treinamento e danga sao zero. Isso representa 
a categoria de gatos que tiveram comida como 
recompensa e dangaram. Quando usamos esse 
tipo de modelo para o teste tea ANOVA, as 
saldas que usamos foram tiradas dos dados 
observados: usamos as medias do grupo (por 
exemplo, veja as Segoes 7.8 e 8.2.2). Entre- 
tanto, com variaveis categoricas as medias sao 
menos significativas porque nao medimos nada 
numa escala ordinal ou intervalar; em vez dis- 
so, temos apenas dados de frequencia. Portanto, 
simplesmente usamos as frequences observa- 
das (em vez das medias observadas) como nos- 


2 Na verdade, a conven§ao e usar o t> 0 como 6 e os va¬ 
lores b como X, mas acredito que essas mudangas nos 
si'mbolos servem somente para confundir as pessoas, 
assim, permanego com o b porque quero enfadzar as 
semelhancas entre a regressao e a ANOVA. 


sos resultados. Na Tabela 16.1, vimos que havia 
28 gatos que tiveram comida como recompensa 
e dangaram; se usarmos isso como resultado 
observado, o modelo pode ser escrito como (se 
ignorarmos o termo erro no momento): 

In (Ojj) = b 0 + bf Treinamento, + fe 2 Danga ; - 
+ /j.Interagao,, 

Para gatos que tiveram como recompensa 
comida e dangaram, as variaveis treinamento 
e danga e a interagao serao 0 , e a equagao se 
reduz a: 

ln(O comidaiSim ) = b 0 + (bi x 0 ) + (b 2 x 0 ) 

+ (b 3 x 0) 

lll(6^comida, sim) t?0 

ln(28) = b 0 
b 0 = 3,332 

Portanto, b 0 no modelo representa o loga¬ 
ritmo natural (In) do valor observado quando 
todas as categorias sao zero. Desse modo, ele 
e o logaritmo natural (In) do valor observado 
da categoria base (nesse caso, gatos que ga- 
nharam comida e dangaram). Agora, vejamos 
o que acontece quando olhamos os gatos que 
tiveram afeto como recompensa e dangaram. 
Nesse caso, a variavel treinamento e 1 e a va¬ 
riavel danga e a interagao sao ainda 0. Tam- 
bem, nossa salda agora muda para ser o valor 
observado para gatos que receberam afeto e 
dangaram (da Tabela 16.1, podemos ver que o 
valor e 48). Portanto, a equagao se torna: 

ln( 0 Afet0iSim ) = b 0 +(b l x 1 ) + (b 2 x 0 ) 

+ (b 3 x 0 ) 

ln(0 Af e.o , Sim) + b j 

b\ = l n (0 A feto, Sim) ~ b Q 

Lembrando que b 0 e o valor esperado 
para gatos que ganharam comida e dangaram, 
temos: 

61 1 u (1 )\v. o 

. Sim) (n(O com ida, sim) 

= ln(48) - ln(28) 

= 3,871 - 3,332 
= 0,539 
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O importante e que b, e a difercnca entre o 
logaritmo natural (In) da frequencia observada 
para gatos que receberam afeto e dan^aram e o 
logaritmo natural (In) dos valores observados 
para gatos que receberam comida e dancaram. 
Em outras palavras, dentro do grupo de gatos 
que dancaram ele representa a difercnca en¬ 
tre aqueles treinados usando comida e aqueles 
treinados com afeto. 

Agora, vejamos o que acontece quando 
olhamos os gatos que tiveram comida como 
recompensa e nao dancaram. Nesse caso, a 
variavel treinamento e 0 , a variavel dan^a e 1 
e a interacao e novamente 0. Nossa sarda ago¬ 
ra muda para ser a frequencia observada para 
gatos que receberam comida, mas nao danga- 
ram (da Tabela 16.1, podemos ver que o valor 
e 10). Assim, a equacao fica: 

ln(0 Co mida,Nao) = ^0 + (fe, x 0) + (b 2 x 1) 

+ {b 3 x 0 ) 

ln( ^Comida, Nao) ^0 A b 2 

b 2 = ln( 0 ComidaiN a 0 ) — b 0 

Lembrando que b 0 e o valor esperado 
para gatos que ganharam comida e dancaram, 
temos: 

^2 InfOcnmjda. Nao) ^Comida, Sim) 

= ln( 10 ) - ln(28) 

= 2,303 - 3,332 
= -1,029 

O importante e que /;, e a diferen^a entre o 
logaritmo natural (In) da frequencia observada 
para gatos que receberam comida e dancaram 
e o logaritmo natural da frequencia observada 
para gatos que receberam comida e nao dan^a- 
ram. Em outras palavras, dentro do grupo dos 
gatos que receberam comida como recompen¬ 
sa, ele representa a difercnca entre gatos que 
nao dancaram e aqueles que dancaram. Final- 
mente, podemos olhar os gatos que ganharam 
afeto e dancaram. Nesse caso, ambas as varia- 
veis treinamento e danca sao lea interacao 
(o valor do treinamento multiplicado pelo va¬ 
lor da danca) tambem e 1. Podemos, tambem, 
trocar b Q , b { e b 2 pelo que sabemos que eles 


representam. A saida e o logaritmo natural (In) 
da frequencia observada para gatos que rece¬ 
beram afeto, mas nao dancaram (esse valor 
esperado e 114 - veja a Tabela 16.1); portanto, 
a equacao fica (abreviei A para afeto, C para 
comida, S para sim e N para nao): 

log( 0 A , N ) = b 0 + (bi x 1 ) + ( b 2 x 1 ) 

+ (b 3 x 1 ) 

IiiIOan) = b 0 + b t + b 2 + b 3 

ln( 0 A , N ) = ln(O c ,s) + [ln( 0 A , s ) - ln(O c ,s)] 

+ [ln( 0 CiN ) - ln(O c ,s)] + b 3 
ln( 0 A N ) = In ( 0 A s ) + In (O c s ) - In (O c s ) 

+ b 3 

b 3 = ln( 0 A , N ) - ln(O c N ) + In (O c s ) 

-ln(0 A , s ) 

= ln( 114) — ln(10) + ln(28) 

- In (48) 

= 1,895 

Assim, o b 3 no modelo realmente compa- 
ra a diferen 5 a entre afeto e comida quando os 
gatos nao dan 9 aram e a difercnca entre comida 
e afeto quando os gatos dancaram. Em outras 
palavras, ele compara o efeito do treinamen¬ 
to quando os gatos nao dancaram ao efeito do 
treinamento quando eles dancaram. 

O modelo final e, portanto: 

ln(Oy) = 3,332 + 0,539Treinamento 
— l,029Dan9a+ l,8951ntera9ao + ln(e tf ) 

O importante a ser observado aqui e que 
tudo e exatamente igual a ANOVA fatorial ex- 
ceto que agora estamos lidando com valores 
transformados logaritmicamente (compare 
essa se 9 ao com a Se 9 ao 10.8 para ver como 
isso tudo e parecido). No caso de voce ainda 
nao acreditar que isso funciona como um MLG 
(Modelo Linear Geral), preparei um arquivo 
chamado CatRegression.sav que content as 
duas variaveis dance (dan 9 a) e training (trei¬ 
namento) (uma variavel auxiliar {dummy) co- 
dificada como zero e a outre como um, como 
esta descrito acima) e a intera 9 ao (int). Existe, 
tambem, uma variavel chamada de observed 
(observado), que content as frequencias obser- 
vadas na Tabela 16.1 para cada combina 9 ao de 
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cl an ^ a e treinamento. Finalmente, existe uma 
variavel chamada de lno, que e o logaritmo 
natural dessas frequencias observadas (lembre 
que nessa secao discutimos os logaritmos dos 
valores observados). Execute uma analise de 
regressao multipla usando esse arquivo com 
lno como a safda e training, dance e inte¬ 
raction como seus tres previsores. A Saida 
16.4 do SPSS mostra a tabela dos coeficientes 
resultantes dessa regressao. Note que a cons- 
tante b 0 e 3,332, como foi calculado acima, 
o valor beta para o tipo de treinamento b, e 
0,539, e para danga b 2 e —1,030, ambos estao 
dentro do erro de arredondamento o qual foi 
calculado acima. Ainda, o coeficiente para a 
intera£ao, b 3 , e 1,895 como previsto. Existe 
um ponto importante: todos os erros padroes 
sao zero ou, colocando de outra forma, nao 
existe erro nesse modelo. Isso porque as di- 
versas combina 9 oes de variaveis codificadas 
explicam completamente os valores observa¬ 
dos. Isso e conhecido como modelo saturado 
e devo retornar a esse ponto mais tarde, por- 
tanto, lembre-se dele. Por ora, espero que isso 
o convenga de que o qui-quadrado pode ser 
conceitualizado como um modelo linear. 

Tudo isso esta muito bem, mas o tftulo 
dessa segao subentende que vou mostrar como 
o teste do qui-quadrado pode ser conceituali¬ 
zado como um modelo linear. Basicamente, o 
teste do qui-quadrado verifica se duas varia¬ 
veis sao independentes; portanto, ele nao tern 
interesse no efeito combinado das duas varia¬ 
veis, somente no seu efeito unico. Assim, po- 


demos conceitualizar o qui-quadrado da mes- 
ma forma que o modelo saturado, apenas nao 
incluimos o termo de interacao. Se remover- 
mos o termo de interacao, nosso modelo fica: 

ln(ModelOy) = b 0 + by Treinamentoj 
+ b 2 Dan 9 a, 

Com esse novo modelo, nao podemos pre- 
ver os valores observados como fizemos com 
o modelo saturado porque perdemos algumas 
informacbes (a saber, o termo de interacao). 
Portanto, a safda do modelo rnuda e, assim, 
os betas mudam tambem. Vimos anterior- 
mente que o teste qui-quadrado e baseado ern 
“frequencias esperadas”. Portanto, se estamos 
conceitualizando o teste qui-quadrado como 
um modelo linear, nossas saidas serao esses va¬ 
lores esperados. Se voce voltar ao infcio deste 
capi'tulo, vera que ja temos as frequencias es¬ 
peradas baseadas nesse modelo. Podemos re- 
calcular os betas baseados no valor esperado: 

In (Ey) = b 0 + ^[Treinamento; + b 2 Da^a^ 

Para gatos que tiveram comida como re- 
compensa e dan^aram, as variaveis de treina¬ 
mento e dan 9 a serao 0 e, assim, a cquacao se 
reduz a: 

ln(£ C omida,Sim) = b 0 + {by x 0) + (b 2 X 0) 

ln(Cfo, T1 |da, Sim) ^0 

b 0 = ln( 14,44) 

= 2,67 


Saida 16.4 do SPSS 


Coefficients 3 (Coeficientes) 


Model 

(Modelo) 

Unstandardized Coefficients 
(Coeficientes nao-padronizados) 

Standardized Coefficients 
(Coeficientes padronizados) 

t 

Sig. 

B 

Std. Erro 
(Erro Padrao) 

Beta 



1 (Constant) (Constante) 

3.332 

0.000 


6.3E+08 

0.000 

Type ofTranining (Tipo 

0.539 

0.000 

0.307 

8.1E+07 

0.000 

de Treinamento) 






Did they dance? (Eles 

-1.030 

0.000 

-0.725 

-1.0E+08 

0.000 

dangaram?) 






interaction (Interapao) 

1.895 

0.000 

1.361 

1.7E+08 

0.000 


a Variavel Dependente: LN (Valores Observados). 
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Portanto, b 0 no modelo representa o loga- 
ritmo do valor esperado quando todas as cate- 
gorias sao 0. 

Quando olhamos os gatos que tiveram 
afeto como recompensa e dangaram, a varia- 
vel treinamento e 1 e a variavel danca e a inte- 
ragao sao ainda 0. Tambem, nossa safda agora 
muda para ser o valor esperado para gatos que 
receberam afeto e dangaram: 

ln(£ A feto, Sim) = bo (^1 X 1) + ( b 2 X 0) 
InC^Afeto.SiJ = bo+ b { 

b l = ln(£ , Afet0> sim ) — b 0 

= ln(£Afeto, Sim) l n (^Comida, Sim) 

= ln(61,56) - ln( 14,44) 

= 1,45 

O importante e que bj e a diferenga entre 
o logaritmo da frequencia esperada para gatos 
que receberam afeto e dangaram e o logaritmo 
dos valores esperados para gatos que recebe¬ 
ram comida e dangaram. Na verdade, os valo¬ 
res sao os mesmos da coluna marginal; isto e, 
a diferenga entre o numero total de gatos que 
ganharam afeto e o numero total de gatos que 
ganharam comida: ln(162) — ln(38) = 1,45. 

Quando olhamos os gatos que ganharam 
comida como recompensa e nao dangaram, a 
variavel treinamento e 0 e a variavel danga e 1. 
Nossa safda agora muda para ser a frequencia 
esperada para gatos que receberam comida, 
mas nao dangaram: 

^(^'Comida.Nao) = ^0 + ib l X 0) + (i), X 1) 

^ n (^'Comida,Nao) = b 0 + b 2 

b 2 = In (0 Comida Nao ) — b 0 

ln(0(; om j da \an) ^(l^Comida. Nao) 

= ln(23,56) — ln( 14,44) 

= 0,49 

Portanto, b,ea diferenga entre o logarit¬ 
mo das frequencias esperadas para gatos que 
receberam comida e dangaram ou nao. Na ver¬ 
dade, o valor e o mesmo do que o da coluna 
marginal; isto e, a diferenga entre o numero 
total de gatos que dangaram ou nao: ln(124) 
- ln(76) = 0,49. 


Podemos verificar novamente tudo isso 
olhando a celula final: 

ln(£Afe(o,Nao) = b 0 +(b l x 1) + (b 2 x 1) 

Afeto, Nao) = b 0 + b t + b 2 

ln( 100,44) = 2,67 + 1,45 + 0,49 
4,61 =4,61 

O modelo final qui-quadrado e, portanto: 

In(Oy) = Modelo,+ In (s t] ) 
ln(Oy) = 2,67 + 1,45Treinamento 
+ 0,49Danga + ln(e,y) 

Podemos reorganizar isso para conseguir 
os resfduos (o termo erro): 

ln(£ij) = ln(Ojj) — Modelo^ 

Nesse caso, o modelo e apenas as frequen¬ 
cias esperadas calculadas para o teste do 
qui-quadrado, assim, os resfduos sao as diferen- 
gas entre as frequencias observadas e esperadas. 

Isso demonstra como o qui-quadrado pode 
funcionar como um modelo linear, como a re- 
gressao e a ANOVA, nos quais os betas nos 
informam algo sobre as diferengas relativas em 
frequencias atraves de categorias das nossas 
duas variaveis. Se voce nao estiver entendendo 
nada, quero que pelo menos voce aprenda com 
essa segao que o qui-quadrado (e a analise de 
dados categoricos, geralmente) pode ser ex- 
presso como um modelo linear (embora tenha- 
mos que usar valores de logaritmos). Podemos 
expressar categorias de uma variavel usando 
variaveis auxiliares (dummy) assim como fize- 
mos com a regressao e a ANOVA e os valores 
betas resultantes podem ser calculados exata- 
mente da mesma que foram calculados para a 
regressao e a ANOVA. Na ANOVA, os valores 
betas representaram as diferengas entre as me- 
dias de uma categoria particular comparada 
com uma categoria base. Com dados categori¬ 
cos, os valores beta representam o mesmo, a 
unica diferenga sendo que em 
vez de tratar de medias, esta- 
mos tratando de valores espe¬ 
rados. Entender essa ideia (que 
regressao, testes t , ANOVAs e 
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analise de dados categoricos sao basicamente 
os mesmos) ira lhe ajudar consideravelmente 
na proxima segao. 

16.5.2 Analise Loglinear ® 

Na segao anterior, tentando explicar que 
a analise de dados categoricos e apenas outra 
forma de regressao, processei os dados atra- 
ves de uma regressao ordinaria no SPSS para 
provar que eu nao estava falando besteira. Na- 
quele momento, avoadamente disse que “oh, 
a proposito, nao existe erro no modelo, estra- 
nho, nao?” e dei importancia ao fato afirman- 
do que era um modelo “saturado” e que nao 
era preciso se preocupar com isso porque eu 
iria explicar mais tarde - assim que eu desco- 
brisse o que estava acontecendo. Parecia uma 
boa tatica para evitar o assunto naquele mo¬ 
mento, mas agora devo explicar isso. 

Para comegar, espero que voce esteja feliz 
com a ideia de que dados categoricos podem ser 
expressos na forma de um modelo linear desde 
que usemos valores de logaritmos (por isso, a 
proposito, a tecnica que estamos usando e cha- 
mada de analise loglinear). Do que voce ja sabe 
sobre a ANOVA e modelos lineares em geral, 
deveria estar deitado na cama bem aconchegado 
com a ideia de que podemos estender qualquer 
modelo linear para incluir qualquer quantidade 
de previsores e qualquer termo de interagao re- 
sultante entre previsores. Portanto, se podemos 
representar uma simples analise categorica de 
duas variaveis em termos de um modelo linear, 
nao deveria impressiona-lo o fato de que se te- 
mos mais do que duas variaveis, isso nao e um 
problema: podemos estender o modelo sim- 
plesmente adicionando qualquer variavel e os 
termos de interagao resultantes. Isso e tudo que 
voce realmente precisa saber. Assim, exatamen- 
te como na regressao multipla e na ANOVA, se 
pensarmos nas coisas em termos de um modelo 
linear, conceitualmente, e muito facil entender 
como o modelo se expande para incorporar no¬ 
vas variaveis. Assim, por exemplo, se tivermos 
tres previsores (A, B e C) na ANOVA (lembre- 
se da Segao 12.3), acabamos com tres interagoes 
de dois fatores (AB, AC, BC) e uma interagao 


de tres fatores (ABC). Portanto, o modelo linear 
resultante disso e apenas: 

Saida^ = (b q -t- A h-,B -t- b 3 C b 4 AB -(- 

b 5 AC -f h 6 BC -f fc 7 ABC) -(- Sj 

Exatamente da mesma maneira, se temos 
tres variaveis numa analise de dados catego¬ 
ricos, conseguimos um modelo identico, mas 
com uma saida em termos de logaritmos: 

1 n (Oijk) = (bo + biAi + b 2 Bj +b 3 C k + b 4 AB rj 
+ b 5 ACjj. + A fl BCj k + b n ABC,jj.) + ln(fip) 

Obviamente, o calculo dos valores de beta e 
dos valores esperados do modelo se torna consi¬ 
deravelmente mais confuso, mas e por isso que 
inventamos computadores: para que nao preci- 
semos nos preocupar com isso! A analise logli¬ 
near funciona com base nesses principios. En- 
tretanto, como vimos no caso de duas variaveis, 
quando nossos dados sao categoricos e inclui- 
mos todos os termos disponiveis (efeitos prin¬ 
cipals e interagoes), nao erramos: nossos previ¬ 
sores podem perfeitamente prever nossa saida 
(os valores esperados). Assim, se comegarmos 
com o modelo mais complexo possfvel, nao 
erramos. A tarefa da analise loglinear e tentar 
ajustar um modelo mais simples aos dados sem 
uma perda substancial do poder preditivo. Por¬ 
tanto, a analise loglinear tipicamente trabalha 
num princfpio de eliminagao de tras pra frente 
(sim, o mesmo tipo de eliminagao de tras para 
frente que podemos usar na regressao multipla 
- veja a Segao 5.5.3.3). Assim, comegamos com 
o modelo saturado e, depois, removemos um 
previsor do modelo e usando esse novo modelo 
prevemos nossos dados (calculando as frequen- 
cias esperadas como no teste do qui-quadrado). 
Entao, verificamos quao bem o modelo se ajusta 
aos dados (isto e, se as frequencias esperadas 
estao proximas das frequencias observadas). 
Se a aderencia do novo modelo nao for muito 
diferente do modelo complexo, abandonamos o 
modelo complexo em favor do novo. Colocando 
de outra maneira. presumimos que o termo que 
removemos nao estava tendo um impacto sig¬ 
nificative na habilidade do nosso modelo para 
prever os dados observados. 
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Entretanto, a analise nao apenas remove 
os termos ao acaso, ela faz isso de forma hie- 
rarquica. Assim, c(imc(:amos com o modelo 
saturado e, depois, removemos a interagao da 
ordem mais alta e avaliamos o efeito que ela 
tinha. Se a remogao desse termo de interagao 
nao afetou o modelo, ele obviamente nao es- 
tava sendo muito util; portanto, nos livramos 
dele e continuamos removendo outras intera- 
goes de ordem mais baixa agora. Se a remogao 
dessas interagoes nao tem impacto, continua¬ 
mos com os efeitos principais ate encontrar- 
mos um efeito que realmente afete a adequa- 
gao do modelo se for removido. 

Colocando isso de forma mais objetiva, 
no infcio desta segao de analise loglinear pedi 
para voce imaginar que estendemos nossos 
exemplos de treinamento e danga para incor- 
porar uma amostra de cachorros. Assim, sabe- 
mos que temos tres variaveis: animal (cachor- 
ro ou gato), treinamento (comida ou afeto) e 
danga (eles dangaram ou nao?). Da mesma 
forma que na ANOVA, isso resulta em tres 
efeitos principais, tres interagoes envolvendo 
duas variaveis e uma interagao envolvendo 
todas as tres variaveis. Assim, temos os se- 
guintes efeitos: animal, treinamento, danga, e 
animal x treinamento, animal x danga, trei¬ 
namento x danga, e animal x treinamento x 
danga. Eliminagao de tras para frente significa 
que a analise loglinear comega incluindo to- 
dos esses efeitos e, depois, pega a ordem de 
interagao mais alta (nesse caso, a interagao de 
tres fatores animal x treinamento x danga) e 
a remove. Ela constroi um novo modelo sem 
essa interagao e a partir do modelo calcula as 
frequencias esperadas. Depois, compara essas 
frequencias esperadas (ou modelo de frequen¬ 
cias) com as frequencias observadas usando 
a equagao padrao para a estatfstica da razao 
da verossimilhanga (veja a Segao 16.2.2). Se 
o novo modelo muda de forma significativa a 
estatfstica da razao da verossimilhanga, remo¬ 
ver esse termo de interagao tem um efeito sig¬ 
nificative na aderencia do modelo e sabemos 
que esse efeito e estatisticamente importante. 
Se esse for o caso, o SPSS ira parar e dira que 
voce tem uma interagao dos tres fatores signi¬ 


ficativa! Ele nao testara outros efeitos porque 
com dados categoricos, todos os efeitos de 
baixa ordem sao consumidos dentro os efei¬ 
tos de alta ordem. Se, entretanto, remover a 
interagao de tres fatores nao afetar de modo 
significativo a aderencia do modelo, o SPSS 
continua com as interagoes de ordem mais 
baixa. Portanto, ele olha para as interagoes 
animal x treinamento, animal x danga e trei¬ 
namento x danga em turnos e constroi mode- 
los em que esses termos nao estao presentes. 
Para cada modelo, ele calcula novamente os 
valores esperados e os compara aos dados ob- 
servados usando a razao de verossimilhanga. 3 
Novamente, se qualquer um desses modelos 
resulta numa mudanga significativa na razao 
de verossimilhanga, o termo e retido e o SPSS 
para de olhar para qualquer efeito principal 
envolvido naquela interagao (assim, se a in¬ 
teragao animal x treinamento e significativa, 
ele nao olhara os efeitos principais de animal 
ou treinamento). Entretanto, se a razao de ve¬ 
rossimilhanga nao mudou, a analise remove 
o termo de interagao prejudicial e continua 
olhando os efeitos principais. 

Mencionei que as estatfsticas de veros¬ 
similhanga (veja a Segao 16.2.2) sao usadas 
para avaliar cada modelo. A partir da equagao 
deveria ficar claro como essa equagao pode 
ser adaptada para se ajustar a qualquer mo¬ 
delo: os valores observados sao os mesmos 
todo o tempo e as frequencias do modelo sao 
simplesmente as esperadas do modelo que 
esta sendo testado. Para o modelo saturado, 
essa estatfstica sera tambem 0 (porque as fre¬ 
quencias observadas e as do modelo sao as 
mesmas, assim, a razao das frequencias ob¬ 
servadas para as do modelo sera 1 e ln(l) = 
0), mas, como vimos, em outras casos ela dara 
uma medida de quao bem o modelo adere as 
frequencias. Para testar se o modelo mudou a 
razao de verossimilhanga, basta tomar a razao 


3 Vale a pena mencionar que para cada modelo, o calculo 
dos valores esperados difere, e quando o projeto fica 
mais complexo, o calculo fica incrivelmente tedioso e 
incompreenslvel (pelo menos para mim); entretanto. 
voce nao precisa fazer os calculos para saber o que esta 
acontecendo. 
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de verossimilhanga de um modelo e subtrai-la 
da estatistica de verossimilhanga do modelo 
anterior (desde que os modelos estejam hie- 
rarquicamente estruturados). 


as categorias de uma das variaveis; (3) colete 
mais dados ou (4) aceite a perda de poder. 

Se voce quer agregar dados em uma das va¬ 
riaveis, alguns fatores devem ser considerados: 


^Xtvludanca 


2 

Modelo Atual 


Lx 


2 

Modelo Anterior 


Nesta segao, tentei lhe dar uma ideia de 
como a analise longlinear funciona sem entrar 
muito nos detalhes dos calculos. Mostrei como 
podemos conceitualizar a analise do qui-qua- 
drado como um modelo linear e, com base no 
que falei previamente sobre a ANOVA, espero 
que voce possa extrapolar essas ideias concei- 
tuais e entender o que esta acontecendo. Os 
curiosos entre voces podem querer saber exa- 
tamente como tudo e calculado e, para essas 
pessoas, tenho duas coisas a dizer: “Eu nao 
sei” e “Eu conheco um bom lugar onde voce 
pode comprar uma camisa de forca”. Se voce 
estiver ainda muito interessado, Tabachnick e 
Field (2001) escreveram, como sempre, um 
capitulo maravilhosamente detalhado sobre 
o assunto, o qual humilha esta mfsera segao. 
Contudo, assumindo que voce esta feliz em 
viver em relativa ignorancia, agora veremos 
como fazer uma analise loglinear. 


16.6 HIPOTESESNA ANALISE 
LOGLINEAR © 

A analise loglinear e uma extensao do teste 
do qui-quadrado e, assim, tern hipoteses simi- 
lares: isto e, um valor deve pertencer a apenas 
uma celula da tabela de contingencia (isto e, as 
celulas da tabela devem ser independentes) e 
as frequencias esperadas devem ser grandes o 
suficiente para uma analise confiavel. Na ana¬ 
lise loglinear com mais do que duas variaveis, 
e possfvel ter ate 20% das celulas com a fre- 
quencia esperada menor do que 5, mas todas 
as celulas devem ter frequencias esperadas 
maiores do que 1. Se essa hipotese nao e sa- 
tisfeita, o resultado e uma reducao tao radical 
no poder do teste que talvez seja melhor nem 
fazer a analise. Solucoes para problemas com 
frequencias esperadas sao (1) agregue os da¬ 
dos de uma das variaveis (de preferencia a que 
voce menos espera ter um efeito!); (2) agregue 


1. A ordern de interagao mais alta nao deve 
ser significativa. 

2. Pelo menos um dos termos de interagao de 
baixa ordem envolvendo a variavel sendo 
agregada deve ser nao-significativo. 

Voltemos ao exemplo que estamos usan- 
do. Digamos que queremos eliminar a variavel 
animal; para isso ser valido, a variavel animal 
x treinamento x danga deve ser nao-signifi- 
cativa e tampouco a interagao animal x trei¬ 
namento ou animal x danga deve ser signifi¬ 
cativa. Voce pode, tambern, agregar categorias 
de uma das variaveis. Assim, se voce tiver a 
variavel “estagoes” com as categorias prima- 
vera, verao, outono e inverno e tem algumas 
observagoes em inverno, poderia reduzir a va¬ 
riavel para tres categorias apenas, primavera, 
verao, outono/inverno. Entretanto, voce deve 
tentar agregar somente categorias que faga 
sentido teorico combinar. 

Finalmente, algumas pessoas superam 
o problema simplesmente adicionando uma 
constante a todas as celulas da tabela, mas nao 
ha razao para tanto porque isso nao resolve a 
questao do poder. 

16.7 ANALISE LOGLINEAR UTILIZANDO 
0 SPSS © 

16.7.1 Consideragoes iniciais © 

Os dados para a analise loglinear sao inse- 
ridos da mesma maneira que para o teste qui- 
quadrado (veja as SegSes 16.4.1 e 16.4.2). Os 
dados para o exemplo do gato e cachorro estao 
no arquivo CatsandDogs.sav. Abra esse ar- 
quivo. Note que ele tem tres variaveis (animal, 
training e dance) (animal, treinamento e dan¬ 
ga) e cada uma contem codigos representando 
as diferentes categorias dessas variaveis. Para 
comegar, devemos usar o comando crosstabs 
(tabulagao cruzada) a fim de obter uma tabela 
de contingencia dos dados. Use a Segao 16.4.3 
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para ajuda-lo a fazer isso. A caixa de dialogo 
final sera semelhante a da Figura 16.4. 

A tabela de tabulagao cruzada produzi- 
da pelo SPSS (Saida 16.5 do SPSS) contem 
o numero de casos que se encaixam em cada 
ccmbinagao de categorias. A metade superior 
dessa tabela e a mesma da Saida 16.1 do SPSS 
porque os dados sao os mesmos (apenas acres- 
centamos alguns cachorros), e se voce reler o 
capftulo tera um resumo sobre o que isso nos 
informa. Para os cachorros, podemos resumir 
os dados de uma maneira semelhante. No total, 
49 cachorros dangaram (70% do total) e des¬ 
ses, 20 foram treinados usando comida (40,8% 
do total que dangou) e 29 foram treinados com 
afeto (59,2% do total que dangou). Vinte e 
um cachorros nao dangaram (30% do total) e, 
desses que nao dangaram, 14 foram treinados 
usando comida como recompensa (66,7% do 
total que nao dangou) e 7 foram treinados pelo 
afeto (33,3% do total que nao dangou). Os mi¬ 
me ros dos cachorros podem ser lidos nas li- 
nhas rotuladas de Count (Contagem) e as per¬ 
centages sao lidas nas linhas chamadas de % 
within Did they dance? (% Eles dangaram?). 
Resumindo, mais cachorros dangaram (70%) 
do que nao dangaram (30%). Aproximada- 
mente metade daqueles que dangaram foram 


treinados com afeto e aproximadamente me¬ 
tade com comida como recompensa. Ou seja, 
os cachorros parecem estar mais propensos a 
dangar do que os gatos (70% comparado com 
38%) e eles estao pouco preocupados com o 
tipo de treinamento usado. 

Antes de continuarmos a olhar os testes 
estatfsticos, e importante conferir se a hipote- 
se da analise longlinear foi satisfeita: mais es- 
pecificamente, nao deverao existir frequencias 
esperadas menores do que 1 e nao mais do que 
20% das celulas podem ter frequencias espe¬ 
radas menores do que 5. Se voce olhar para a 
tabela de tabulagao cruzada, devera notar que 
o menor valor esperado e 10,2 (para cachorros 
que foram treinados com comida e nao danga¬ 
ram). Esse valor e maior do que 5 e, assim, a 
hipotese e verificada. 

16.7.2 A Analise Loglinear © 

Tendo estabelecido que a hipotese foi 
verificada, podemos seguir com a anali¬ 
se principal. A melhor maneira de proces- 
sar uma analise longlinear e usar o menu 
Analyze=>LogIinear=>Statistics=>Model 
Selection. .. (Analisar=>Loglinear=>Estatistic 
as=>Selegao do Modelo...) para acessar a cai- 



Figura 16.4 Caixa de dialogo Crosstabs. 
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Saida 16.5 do SPSS 

Did They dance? * Type of Training * Animal Crosstabulation (Eles dangaram? 
*Tipo de treinamento * Tabulagao cruzada do Animal) 


Animal 

(Animal) 

Type of Training (Tipo 
de treinamento) 

Total 

Food as 
Reward 
(Comida como 
recompensa) 

Affection 
as Reward 
(Afeto como 
recompensa) 

Gato Did they Yes Count (Contagem) 

28 

48 

76 

dance? (Sim) Expected Count (Contagem Esperada) 

14.4 

61.6 

76.0 

(Eles dan- % within Did they dance? (% dentro de 

36.8% 

63.2% 

100.0% 

garam?) Eles dangaram?) 




% within Type of Training (% dentro do 

73.7% 

29.6% 

38.0% 

Tipo de Treinamento) 




% of total (% do total) 

14.0% 

24.0% 

38.0% 

No Count (Contagem) 

10 

114 

124 

(Nao) Expected Count (Contagem Esperada) 

23.6 

100.4 

124.0 

% within Did they dance? (% dentro de 

8.1% 

91.9% 

100.0% 

Eles dangaram?) 




% within Type of Training (% dentro do 

26.3% 

70.4% 

62.0% 

Tipo de Treinamento) 




% of total (% do total) 

5.0% 

57.0% 

62.0% 

Total Count (Contagem) 

38 

162 

200 

Expected Count (Contagem Esperada) 

38.0 

162.0 

200.0 

% within Did they dance? (% dentro de 

19.0% 

81.0% 

100.0% 

Eles dangaram?) 




% within Type of Training (% dentro do 

100.0% 

100.0% 

100.0% 

Tipo de Treinamento) 




% of total (% do total) 

19.0% 

81.0% 

100.0% 

Cao Did they Yes Count (Contagem) 

20 

29 

49 

dance? (Sim) Expected Count (Contagem Esperada) 

23.8 

25.2 

49.0 

(Eles dan- % within Did they dance? (% dentro de 

40.8% 

59.2% 

100.0% 

garam?) Eles dangaram?) 




% within Type of Training (% dentro do 

58.8% 

80.6% 

70.0% 

Tipo de Treinamento) 




% of total (% do total) 

28.6% 

41.4% 

70.0% 

No Count (Contagem) 

14 

7 

21 

(Nao) Expected Count (Contagem Esperada) 

10.2 

10.8 

21.0 

% within Did they dance? (% dentro de 

66.7% 

33.3% 

100.0% 

Eles dangaram?) 




% within Type of Training (% dentro do 

41.2% 

19.4% 

30.0% 

Tipo de Treinamento) 




% of total (% do total) 

20.0% 

10.0% 

30.0% 

Total Count (Contagem) 

34 

36 

70 

Expected Count (Contagem Esperada) 

34.0 

36.0 

70.0 

% within Did they dance? (% dentro de 

48.6% 

51.4% 

100.0% 

Eles dangaram?) 




% within Type of Training (% dentro do 

100.0% 

100.0% 

100.0% 

Tipo de Treinamento) 




% of total (% do total) 

48.6% 

51.4% 

100.0% 


xa de dialogo principal como a da Figura 16.5. 
Marque qualquer variavel que voce queira in- 
cluir na analise selecionando-a com o mouse 
e transfira-a para a caixa Factor(s) (Fatores) 


clicando em LlI. Quando existe uma variavel 
nessa caixa a tecla (Definir Intervalo) 

e ativada. Da mesma forma como no teste t e 
varios dos testes nao-parametricos que discuti- 
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Loglinear Analysis: Define Range [ X 
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Contnue | 

Mawmun 


Cancel 






Figura 16.5 Caixa de dialogo principal da analise loglinear. 


mos no Capftulo 13, precisamos dizer ao SPSS 
os codigos que usamos para definir nossas va- 
riaveis categoricas. Selecione uma variavel na 
caixa Factor(s) (Fatores) e clique em I 0 *'- 
(Definir Intervalo) para ativar a caixa de dia¬ 
logo que permite especificar o valor dos co¬ 
digos mmimo e maximo que voce usou para 
aquela variavel. Todas as tres variaveis nesse 
exemplo tem os mesmos codigos (todas elas 
apresentam duas categorias e foram codifica- 
das como 0 e 1), assim, podemos selecionar 
as tres; clique em l c (Definir Intervalo) e 
digite 0 na caixa Minimum (Mlnimo) e 1 na 
caixa Maximum (Maximo). Depois de fazer 
isso, clique em co "-- (Continuar) para retornar 
a caixa de dialogo principal. 

As opgSes por padrao na caixa principal 
sao adequadas; o mais importante a ser notado 
e que, por omissao, o SPSS usa a eliminagao 
para tras ( Backwards ). Voce pode selecionar 
Enter in a single step (Entrar de uma unica 
vez), que e um metodo nao hierarquico (no 
qual todos os efeitos entram e sao avaliados, 
como a entrada forgada na regressao multipla). 
Na analise loglinear, os efeitos combinados 
tem prioridade sobre os efeitos de baixa ordem 
e, assim, nao ha razao para recomendar meto- 
dos nao hierarquicos. 

Se voce clicar em m*** 1 (Modelo), abrira 
uma caixa de dialogo semelhante a uma vista 


na ANOVA (veja a Figura 10.2). Por padrao, 
o SPSS ajusta o modelo saturado e e esse que 
devemos tentar. Entretanto, voce pode definir 
seu proprio modelo, se quiser, especificando 
efeitos especiais principals e termos de intera- 
gao. A nao ser que voce tenha um bom motivo 
para nao ajustar o modelo saturado, deixe as 
coisas como estao! 

Clicar em apaorit (Opgoes) abre uma cai¬ 
xa de dialogo semelhante a da Figura 16.6. 
Existem poucas opgoes (as opgoes por omis¬ 
sao sao boas). As tinicas duas coisas que voce 
pode selecionar sao Parameter estimates 
(Estimativas dos parametros), que produzira 
uma tabela de estimativas parametricas para 


Loglinear Analysis: Options 


Figura 16.6 Opgoes para a analise Loglinear. 
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cada efeito (por estimativas parametricas, 
quero dizer apenas o escore-z e o intervalo de 
confianga associado) e uma Association Ta¬ 
ble (Tabela de Associagao), que produzira as 
estatfsticas qui-quadrado para todos os efeitos 
do modelo. Isso pode ser util em algumas si- 
tuacoes, mas, como escrevi anteriormente, se 
as interagoes de alta ordem sao significativas, 
nao deveriamos estar interessados nos efeitos 
de baixa ordem porque eles sao confundidos 
com os efeitos de alta ordem. Quando voce 
terminar com as opcoes, clique em cm ~- (Con- 
tinuar) para retornar a caixa de dialogo princi¬ 
pal e clique em °* para executar a analise. 

16.8 SAIDAS DA ANALISE 
LOGLINEAR © 

A Saida 16.6 do SPSS mostra a safda ini- 
cial da analise loglinear. A safda nos informa 
que temos 270 casos (lembre que tfnhamos 
200 gatos e 70 caes; esse e um bom momen- 
to para verificar que nenhum caso se perdeu!). 
O SPSS lista todos os fatores do modelo com 
o numero de nfveis de cada um (nesse caso, 
todos tem dois nfveis). Para comecar, o SPSS 
ajusta o modelo saturado (todos os termos es- 
tao no modelo, incluindo a interagao de alta or¬ 
dem, nesse caso, a interacao animal x treina- 
mento x danga). O SPSS fornece a contagem 
observada e esperada para cada combinagao de 
categorias do modelo. Esses valores devem ser 
os mesmos da tabela original de contingencia, 
exceto que cada celula tem o valor 0,5 adicio- 
nado (esse e o valor padrao e ele e bom, mas se 
voce quiser troca-lo, pode faze-lo mudando o 
delta como na Figura 16.6). A parte final dessa 
safda inicial fornece duas estatfsticas de ade- 
rencia (qui-quadrado de Pearson e a estatistica 
da razao de verossimilhanga, ambas vistas no 
comego deste capftulo). Nesse contexto, esses 
testes estao testando a hipotese de que as fre¬ 
quencias previstas pelo modelo (as frequen- 
cias esperadas) sao significativamente diferen- 
tes das frequencias reais dos nossos dados (as 
frequencias observadas). Se o seu modelo esta 
bem ajustado aos dados, as frequencias obser¬ 
vadas e esperadas devem ser muito parecidas 


(isto e, nao-significativamente diferentes). Por- 
tanto, queremos que essas estatfsticas sejant 
nao-significativas. Um resultado significativo 
significaria que nosso modelo foi significati¬ 
vamente diferente dos nossos dados (isto e, o 
modelo e um pessimo ajuste dos dados). Em 
amostras grandes, essas estatfsticas deveriam 
dar os mesmos resultados, mas a estatistica da 
razao de verossimilhanga deve ser preferida 
em amostras pequenas. Nesse exemplo, ambas 
as estatfsticas sao 0 e fornecem um valor de 
probabilidade p, of-INF, que e uma maneira 
confusa de dizer que a probabilidade e muito 
alta. Em outras palavras, nesse estagio o mo¬ 
delo preve perfeitamente os dados. Se voce leu 
a segao teorica, isso nao deveria surpreende-lo, 
porque la mostrei que o modelo saturado e um 
ajuste perfeito dos dados e mencionei que a ra¬ 
zao de verossimilhanga resultante seria zero. 
O interessante na analise loglinear e que pode- 
mos remover partes do modelo sem afetar de 
modo significativo o ajuste do modelo. 

A proxima parte da safda (Safda 16.7 do 
SPSS) infornta quais componentes do mode¬ 
lo podem ser removidos. A primeira parte da 
safda e rotulada de Tests that K-way and hi¬ 
gher order efects are zero (Testa se o fator 
de ordem k ou maior e zero) e abaixo ha uma 
tabela mostrando a razao de verossimilhanga e 
a estatistica qui-quadrado quando K = 3, 2 e 1 
(descendo pelas linhas da tabela). A primeira 
linha (K = 3) testa se remover o efeito de tres 
fatores e os efeitos de alta ordem ira afetar de 
modo significativo o ajuste do modelo. Agora, 
e claro, a interagao de tres fatores e o efeito 
de alta ordem que temos, assirn, simplesmen- 
te testamos se a remogao da interagao de tres 
fatores (isto e, a interagao animal x treina- 
mento x danga) ira afetar significativamente 
o ajuste do nosso modelo. Se voce olhar as 
duas colunas rotuladas de Prob, podera ver 
que ambos os testes, qui-quadrado e a razao 
de verossimilhanga, concordam que remover 
essa interagao afetara de forma significativa 
o ajuste do modelo (porque a probabilidade 
e menor do que 0,05). A proxima linha da ta¬ 
bela (K = 2) nos diz se remover as interagoes 
de dois fatores (isto e, as interagoes animal x 
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Saida 16.6 do SPSS 


**************** hierarchical log linear **************** 

(LOG LINEAR HIERARQUICO) 

DATA information (Informagao dos dados) 

270 unweighted cases accepted (270 casos nao ponderados aceitos). 

0 cases rejected because of out-of-range factor values 
(0 casos rejeitados porque estao fora do intervalo de valores) 

0 cases rejected because of missing data (0 casos rejeitados por dados omitidos). 

270 weighted cases will be used in the analysis (270 casos ponderados serao usados na 
analise). 

FACTOR information (Informagao dos Fatores) 

Factor (Fator) Level (Nivel) Label (Rotulo) 

ANIMAL (ANIMAL) 2 Animal (Animal) 

TRAINING (TREINAMENTO) 2 Type of Training (Tipo de Treinamento) 

DANCE (DANQA) 2 Did they dance? (Eles dangaram?) 


DESIGN 1 has generating class (0 DELINEAMENTO 1 tern classe geradora) 

ANIMAL*TRAINING*DANCE (ANIMAL*TREINAMENTO*DANQA) 

Note: For saturated models .500 has been added to all observed cells. 

(Nota: Para modelos saturados, 0,500 foi acrescido a todas as celulas observadas). 
The value may be changed by using the CRITERIA - DELTA subcommand. 

(Esse valor pode ser trocado usando o subcomando CRITERIO = DELTA) 

The Iterative Proportional Fit algorithm converged at iteration 1. 

(0 algoritmo interativo de aderencia proporcional convergiu na interagao 1). 

The maximum difference between observed and fitted marginal totals is .000 and 
the convergence criterion is .250 (A diferenga maxima entre os totais marginais 
observados e ajustados e 0,000 e o criterio de convergencia e 0,250) . 


Observed, Expected Frequencies and Residuals (Frequencias observadas, esperadas e 
residuos). 


Factor 

Code 

OBS Count 

EXP Count 

Residual 

Std Resid 

(Fator) 

(Codigo) (Contagem OBS) 

(Contagem 

esp; 

l (Residuos) (Residuos PAD) 

ANIMAL cat (gato) 






TRAINING 

Food As 






(TREINAMENTO) (Com Comida) 






DANCE (Danga) 

Yes (Sim) 

28.5 

28.5 


0.00 

0.00 

DANCE (Danga) 

No (Nao) 

10.5 

10.5 


0.00 

0.00 

TRAINING 

Af fectio 






(TREINAMENTO) 

(Com Afeto) 






DANCE 

Yes (Sim) 

48.5 

48.5 


0.00 

0.00 

DANCE 

No (Nao) 

114.5 

114.5 


0.00 

0.00 

ANIMAL Dog (Cao) 






TRAINING 

Food As 






(TREINAMENTO) 

(Com Comida) 






DANCE (Danga) 

Yes (Sim) 

20.5 

20.5 


0.00 

0.00 

DANCE (Danga) 

No (Nao) 

14.5 

14.5 


0.00 

0.00 

TRAINING 

Af fectio 






(TREINAMENTO) 

(Com Afeto) 






DANCE 

Yes (Sim) 

29.5 

29.5 


0.00 

0.00 

DANCE 

No (Nao) 

7.5 

7.5 


0.00 

0.00 

Goodness-of-fit 

test Statistics 

(Estatisticas 

de Aderencia 

do Teste) 


Likelihood ratio chi square = 


0.00000 

DF 

= 0 P = -INF 


(Qui-quadrado Razao de verossimilhanga = 

0.00000 

GL 

= 0 P = - INF) 



Pearson chi square = 

0.00000 

DF 

= 0 P = -INF 



(Qui-quadrado de 

Pearson = 

0.00000 

GL 

= 0 P = -INF) 
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Saida 16.7 do SPSS 


Tests that 

K-way and higher order 

effects are 

zero. 



(Testa se os efeitos do fator k ou 

de ordem mais alta sao zero 

). 


K 

DF 

L. R. Chisq 

Prob 

Pearson Chisq 

Prob 

Iteration 

(K) 

(6L) 

(X 2 Razao de Ver. 

(Probab.) 

(X 2 de Pearson) 

(Probab. 

) (Iteragao) 

3 

1 

20.305 

0.0000 

20.778 

0.0000 

4 

2 

4 

72.267 

0.0000 

67.174 

0.0000 

2 

1 

7 

200.163 

0.0000 

253.556 

0.0000 

0 

Tests that 

K-way 

effects are zero 

(Testa se os 

efeitos de ordem k sao 

zero). 

K 

DF 

L. R. Chisq 

Prob 

Pearson Chisq 

Prob 

Iteration 

(K) 

(GL) 

(X 2 Razao de Ver. 

(Probab.) 

(X 2 de Pearson) 

(Probab. 

) (Iteragao) 

3 

3 

127.896 

0.0000 

186.382 

0.0000 

0 

2 

3 

51.962 

0.0000 

46.396 

0.0000 

0 

1 

1 

20.305 

0.0000 

20.778 

0.0000 

0 


treinamento, animal x danga e treinamento x 
danga) e qualquer efeito de alta ordem ira afe- 
tar o modelo. Nesse caso, existe um efeito de 
alta ordem (a interagao de tres fatores), assim, 
isso testa se a remogao das interagoes de dois 
fatores e da interagao de tres fatores ira afetar 
o ajuste do modelo. Isso e altamente signifi- 
cativo (o que nao deveria surpreende-lo por- 
que o teste contem a interagao de tres fatores 
que, como ja vimos, e altamente significativa) 
indicando que se removermos as interagoes 
de dois fatores e a interagao de tres fatores, 
isso tera um efeito detrimental significativo 
no modelo. A linha final (K = 1) nos diz que 
remover os efeitos de um fator (isto e, os efei- 
tos principals de animal, treinamento e danga) 
e efeitos de alta ordem ira significativamen- 
te afetar o ajuste do modelo. Existem muitos 
efeitos de alta ordem aqui - existem interagoes 
de dois fatores e interagao de tres fatores - e, 
assim, isso e basicamente testar se remover 
tudo do modelo tera um efeito significativo no 
ajuste do modelo. Isso, e altamente significati¬ 
vo (o que deverfamos esperar porque, como ja 
vimos, a interagao de tres efeitos e altamente 
significativa e esse teste inclui aquela intera¬ 
gao). Se esse teste nao fosse significativo (se 
os valores de Prob estivessem acima de 0,05), 
isso lhe informaria que remover tudo do seu 
modelo nao afetaria o ajuste do modelo (em 


outras palavras, o efeito combinado de suas 
variaveis e as interagoes nao seriam significa- 
tivas). 

A proxima parte da tabela expressa a 
mesma coisa, mas nao inclui os efeitos de alta 
ordem. Ela e rotulada de Tests that K-way 
effects are zero (Testa se os efeitos de ordem 
K sao zero), e lista testes onde K = 1, 2 e 3. 
A primeira linha (K = 1), portanto, testa se 
ao remover os efeitos principals (os efeitos de 
um fator) ocorre um efeito detrimental signi¬ 
ficativo no modelo. A probabilidade e menor 
do que 0,05, indicando que se removermos o 
efeito principal de animal, treinamento e dan¬ 
ga do nosso modelo, isso ira afetar significati- 
vamente o ajuste do modelo (em outras pala¬ 
vras, esses efeitos sao previsores significativos 
dos dados). A segunda linha (K = 2) testa se 
ao remover as interagoes de dois fatores ha um 
efeito detrimental significativo no modelo. A 
probabilidade e menor do que 0,05, indican¬ 
do que se removermos as interagoes animal 
x treinamento, animal x danga e treinamento 
x danga, isso ira reduzir significativamente o 
ajuste do modelo aos dados. A linha final (K 
= 3) testa se ao remover a interagao de tres 
fatores ha um efeito detrimental significativo 
no modelo. A probabilidade e menor do que 
0,05, indicando que se removermos a intera¬ 
gao animal x treinamento x danga, o ajuste 






632 Andy Field 


dos dados ao modelo ira reduzir significati- 
vamente. Em outras palavras, essa interagao 
de tres fatores e um previsor significativo dos 
dados. Essa linha deve ser identica a primeira 
linha da tabela anterior (Testes onde efeitos de 
ordem K sao zero) porque ela e um efeito de 
alta ordem e, assim, na tabela anterior nao ha- 
via efeitos de alta ordem para incluir no teste 
(veja a safda e voce percebera que os resulta- 
dos sao identicos). 

Isso nos mostra que a interagao de tres 
fatores e significativa: remove-la do modelo 
tem um efeito significativo no ajuste do mo¬ 
delo aos dados. Tambem sabemos que remo¬ 
ver todas as interagoes de dois fatores tem um 
efeito significativo no modelo, mas voce deve 
lembrar que a analise loglinear deve ser feita 
hierarquicamente. Assim, essas interagbes de 
dois fatores nao sao do nosso interesse porque 
a interagao de tres fatores e significativa (so- 
mente olhariamos para esses efeitos se a inte¬ 
ragao de tres fatores fosse nao-significativa). 

Se voce selecionou Association table (Ta¬ 
bela de associagao) como na Figura 16.6, tera 
a tabela de Saida 16.8 do SPSS. Isso simples- 
mente desmembra a tabela que acabamos de 
olhar em suas partes componentes. Assim, por 
exemplo, embora saibamos da saida anterior 
que remover todas as interagoes de dois fa¬ 
tores afeta significativamente o modelo, nao 
sabemos qual das interagoes de dois fatores 
esta ocasionando o efeito. Essa tabela nos diz. 
Temos o teste qui-quadrado de Pearson para 


cada interagao de dois fatores e para os efeitos 
principais, e a coluna rotulada de Prob infor¬ 
ma qual desses efeitos e significativo (valores 
menores do que 0,05 sao significativos). Po- 
demos afirmar disso que as interagoes animal 
x danga, treinamento x danga e animal x 
treinamento sao todas significativas. Da mes- 
ma forma, vimos na saida anterior que a re- 
mogao dos efeitos de um fator (os efeitos prin¬ 
cipais de animal, treinamento e danga) afetou 
significativamente o ajuste do modelo e essas 
descobertas estao confirmadas aqui porque os 
efeitos principais de animal e treinamento sao 
significativos. Entretanto, o efeito principal de 
danga nao e (a probabilidade e maior do que 
0,05). Mesmo que essas descobertas sejam in- 
teressantes, devemos ignora-las devido a na- 
tureza hierarquica da analise longlinear: esses 
efeitos sao confundidos com a interagao de 
alta ordem de animal x treinamento x danga. 

Se voce selecionou Parameter estimates 
(Estimativas dos parametros) conforme a Fi¬ 
gura 16.6, tera a tabela da Safda 16.9 do SPSS. 
Ela informa o mesmo da tabela anterior (isto e, 
ela fornece estimativas individuais para cada 
efeito), mas faz isso usando o escore-z em vez 
do teste qui-quadrado. Isso pode ser util por¬ 
que temos intervalos de confianga e, tambem, 
porque o valor de z fornece uma comparagao 
util entre os efeitos (se voce ignorar o sinal de 
mais ou menos, quanto maior o z, mais sig¬ 
nificativo o efeito e). Assim, se voce olhar os 
valores de z podera ver que o efeito principal 


Saida 16.8 do SPSS 


******** HIERARCHICAL LOG LINEAR 


Tests of PARTIAL association (Testes de 

Effect Name (Nome do Efeito) 

ANIMAL*TRAINING (ANIMAL*TREINAMENTO) 
ANIMAL*DANCE (ANIMAL*DAN£A) 

TRAINING*DANCE (TREINAMENTO*DAN£A) 
ANIMAL (ANIMAL) 

TRAINING (TREINAMENTO) 

DANCE (DAN£A) 


(LOG LINEAR HIERARQUICO) ******** 
associagao PARCIAL) 


DF 

(GL) 

Partial Chisq 
(X 2 Parcial) 

Prob 

Iter 

(Iteragao) 

1 

13.760 

0.0002 

2 

1 

13.748 

0.0002 

2 

1 

8.611 

0.0033 

2 

1 

65.268 

0.0000 

2 

1 

61.145 

0.0000 

2 

1 

1.483 

0.2233 

2 
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Saida do SPSS 16.9 


Note: For saturated models .500 has been added to all observed cells. 

(Nota: Para modelos saturados, 0,500 foi somado a todas as celulas observadas). 
This value may be changed by using the CRITERIA - DELTA subcommand. 

(Esse valor pode ser trocado usando o sub-comando CRITERIO = DELTA) 


Estimates for Parameters (Estimativas para os Parametros) 
ANIMAL*TRAINING*DANCE (ANIMAL*TREINAMENTO*DANgA) 


Parameter 

(Parametro) 

Coeff. 

(Coeficiente) 

Std. Err. 
(Erro Padrao) 

Z-Value 
(Valor de Z) 

95 Cl Lower 
(Lim. Inf. do 

IC de 95%) 

95 Cl Upper 
(Lim. Sup. Do 
IC de 95%) 

1 

0.3600938577 

0.08335 

4.32010 

0.19672 

0.52347 

ANIMAL* TRAINING (ANIMAL*TREINAMENTO) 




Parameter 

(Parametro) 

Coeff. 

(Coeficiente) 

Std. Err. 
(Erro Padrao) 

Z-Value 
(Valor de Z) 

95 Cl Lower 
(Lim. Inf. do 

IC de 95%) 

95 Cl Upper 
(Lim. Sup. Do 
IC de 95%) 

1 

0.4020174410 

0.08335 

-4.82306 

-0.56539 

-0.23865 

ANIMAL*DANCE 

(ANIMAL* DANgA) 





Parameter 

(Parametro) 

Coeff. 

(Coeficiente) 

Std. Err. 
(Erro Padrao) 

Z-Value 
(Valor de Z) 

95 Cl Lower 
(Lim. Inf. do 

IC de 95%) 

95 Cl Upper 
(Lim. Sup. Do 
IC de 95%) 

1 

-0.1970307093 

0.08335 

-2.36381 

-0.36040 

-0.03366 

TRAINING*DANCE (TREINAMENTO *DAN£A) 




Parameter 

(Parametro) 

Coeff. 

(Coeficiente) 

Std. Err. 
(Erro Padrao) 

Z-Value 
(Valor de Z) 

95 Cl Lower 
(Lim. Inf. do 

IC de 95%) 

95 Cl Upper 
(Lim. Sup. Do 
IC de 95%) 

1 

0.1042911061 

0.08335 

1.25120 

-0.05908 

0.26766 

ANIMAL (ANIMAL) 





Parameter 

(Parametro) 

Coeff. 

(Coeficiente) 

Std. Err. 
(Erro Padrao) 

Z-Value 
(Valor de Z) 

95 Cl Lower 
(Lim. Inf. do 

IC de 95%) 

95 Cl Upper 
(Lim. Sup. Do 
IC de 95%) 

1 

0.4036938932 

0.08335 

4.84318 

0.20032 

0.56707 

TRAINING (TREINAMENTO) 





Parameter 

(Parametro) 

Coeff. 

(Coeficiente) 

Std. Err. 
(Erro Padrao) 

Z-Value 
(Valor de Z) 

95 Cl Lower 
(Lim. Inf. do 

IC de 95%) 

95 Cl Upper 
(Lim. Sup. Do 
IC de 95%) 

1 

-0.3281973781 

0.08335 

-3.93743 

-0.49157 

-0.16483 

DANCE (DANgA) 





Parameter 

(Parametro) 

Coeff. 

(Coeficiente) 

Std. Err. 
(Erro Padrao) 

Z-Value 
(Valor de Z) 

95 Cl Lower 
(Lim. Inf. do 

IC de 95%) 

95 Cl Upper 
(Lim. Sup. Do 
IC de 95%) 

1 

0.2319101606 

0.08335 

2.78226 

0.06854 

0.39528 


de animal e o efeito mais importante do mo- 
delo (z = 4,84), seguido pela intera^o animal 
x treinamento (z = — 4,82) e, depois, pela 
intera^ao animal x treinamento x dan§a (z = 
4,32), e assim por diante. Entretanto, vale a 
pena reiterar que, nesse caso, nao precisamos 


nos preocupar com nada alem da intera 9 ao de 
tres fatores. 

A parte final da safda (Saida 16.10 do SPSS) 
trata da elimina$ao para tras. O SPSS comecjara 
com o efeito de mais alta ordem (nesse caso, a 
interagao animal x treinamento x dan 9 a) tiran- 
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Saida 16.10 do SPSS 


******** hierarchical log linear (log linear hierarquico) ******** 

Backward Elimination (p = .050) for DESIGN 1 with generating class 
(Eliminagao para tras (p = 0.050) para o DELINEAMENTO 1 com classe gerada) 

ANIMAL*TRAINING*DANCE (ANIMAL*TREINAMENTO*DANQA) 

Likelihood Ratio Chi Square = 0.00000 DF = 0 P = -INF 

(/ 2 da razao da verossimilhanga = 0.00000 GL = 0 P = -INF) 


If Deleted Simple Effect is 

DF 

(GL) 

L.R. Chisq Change 
(X 2 da razao da 

Prob. 

Iter. 

(Se o efeito simples eliminado e) 


veros similhanga) 

(Probab.) 

(Iteragao) 

ANIMAL*TRAINING*DANCE 
(ANIMAL*TREINAMENTO*DAN^A) 

1 

20.305 

0.0000 

4 


Step 1 (Passo 1) 

The Best model has generating class (O melhor modelo tern classe geradora) 
ANIMAL*TRAINING*DANCE (ANIMAL*TREINAMENTO*DANQA) 

Likelihood Ratio Chi Square = 0.00000 DF = 0 P = -INF 

(X 2 da razao da verossimilhanga = 0.00000 GL = 0 P = -INF) 


The Final model has generating class (0 modelo final tern classe geradora) 

ANIMAL*TRAINING*DANCE (ANIMAL*TREINAMENTO*DANQA) 

The Iterative Proportional Fit algorithm converged at iteration 0. 

(0 algoritmo interativo de aderencia proporcional convergiu na iteragao 1). 

The maximum difference between observed and fitted marginal totals is .000 and 
the convergence criterion is .250 (A diferenga maxima entre os totais marginais 
observados e ajustados e 0,000 e o criterio de convergencia e 0,250) . 


Observed, Expected Frequencies and Residuals (Frequencias observadas, esperadas e 
residuos). 


Factor 

Code 

OBS Count 

EXP Count 

Residual 

Std Resid 

(Fator) 

(Codigo) 

(Contagem OBS) 

(Contagem ESP) 

(Residuos) 

(Residuos PAD) 

ANIMAL cat (gato) 





TRAINING 

Food As 





(TREINAMENTO) 

(Com Comida) 





DANCE (Danga) 

Yes (Sim) 

28.0 

28.0 

0.00 

0.00 

DANCE (Danga) 

No (Nao) 

10.0 

10.0 

0.00 

0.00 

TRAINING 

Affection 





(TREINAMENTO) 

(Com Afeto) 





DANCE 

Yes (Sim) 

48.0 

48.0 

0.00 

0.00 

DANCE 

No (Nao) 

114.0 

114.0 

0.00 

0.00 

ANIMAL Dog (Cao) 





TRAINING 

Food As 





(TREINAMENTO) 

(Com Comida) 





DANCE (Danga) 

Yes (Sim) 

20.0 

20.0 

0.00 

0.00 

DANCE (Danga) 

No (Nao) 

14.0 

14.0 

0.00 

0.00 

TRAINING 

Affection 





(TREINAMENTO) 

(Com Afeto) 





DANCE 

Yes (Sim) 

29.0 

29.0 

0.00 

0.00 

DANCE 

No (Nao) 

7.0 

7.0 

0.00 

0.00 


Goodness-of-fit test Statistics (Estatisticas de Aderencia do Teste) 


Likelihood ratio chi square = 

0.00000 

DF = 0 

P = 

-INF 

(Qui-quadrado Razao de verossimilhanga = 

0.00000 

GL = 0 

P = 

- INF) 

Pearson chi square = 

0.00000 

DF = 0 

P = 

-INF 

(Qui-quadrado de Pearson = 

0.00000 

GL = 0 

P = 

-INF) 
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do-o do modelo e verificando que efeito isso 
acarreta. Se isso nao tiver um efeito significativo, 
ele vai para os efeitos mais altos seguintes (nesse 
caso, a intera 9 ao de dois fatores). Entretanto, ja 
vimos que a remogao da interagao de tres fatores 
tera um efeito significativo e isso e confirma- 
do, nesse estagio, pela tabela If Deleted Sim¬ 
ple Effect is (Se o efeito simples eliminado e), 
a qual confirma que a remogao da intera^ao de 
tres fatores tem um efeito significativo no mode¬ 
lo. Portanto, a analise acaba aqui: a interagao de 
tres fatores nao e removida e o SPSS avalia esse 
modelo final. A parte da safda rotulada de The 
Best model has generating class (O melhor 
modelo tem uma classe geradora) informa que o 
modelo que melhor se ajusta aos dados inclui a 
interagao de tres fatores e, por causa da natureza 
hierarquica da analise, esse e o unico efeito que 
precisamos interpretar. Finalmente, o SPSS ava¬ 
lia esse modelo final com a estatistica da razao 
de verossimilhanga, e estamos buscando um tes¬ 
te estatlstico nao-significativo que indique que 
os valores esperados gerados pelo modelo nao 
sao significativamente diferentes dos dados ob- 
servados (colocando de outra maneira, o modelo 
se ajusta bem aos dados). Nesse caso, o resulta- 
do e nao-significativo, indicando que o modelo 
se ajusta bem aos dados. 4 


O proximo passo e 
tentar interpretar essa 
interacao. Primeiro de- 
vemos representar as 
frequences de todas as 
categorias. Voce deve 
apresentar as frequen¬ 
cias em termos de per- 
centuais do total (esses 
valores podem ser en- 
contrados na tabula 9 ao cruzada apresentada na 
Saida 16.5 do SPSS nas linhas rotuladas de % 



4 O fato de que a analise parou aqui nao e util porque nao 
posso mostrar como ela procederia no caso de uma in- 
teragao nao-significativa de tres fatores. Entretanto, ela 
realmente simplifica as coisas e se voce estiver interes- 
sado em explorar mais a analise loglinear, as tarefas no 
final do capftulo e as respostas dispomveis no site www. 
artmed.com.br mostram o que acontece quando a intera- 
gao de mais alta ordem e nao-significativa. 


of Total (% do total)). O grafico resultante e 
mostrado na Figura 16.7, e revela o que ja sabe- 
mos sobre gatos: eles irao dan 9 ar (ou fazer 
qualquer coisa) quando ha comida envolvida, 
mas se voce treina-los com afeto eles nao estao 
interessados. Caes, por outro lado, dan 9 arao 
quando ganharem afeto (na verdade, mais caes 
dan 9 aram do que nao dan 9 aram independe- 
mente do tipo de recompensa, mas o efeito e 
mais pronunciado quando o afeto foi utilizado 
como metodo de treinamento). Os dois tipos de 
animais mostram respostas similares ao treina¬ 
mento com comida, mas os gatos nada fazem 
por afeto. Assim, gatos sao criaturas senslveis 
que fazem coisas estupidas somente quando ha 
uma boa recompensa para eles (isto e, comida), 
ja os caes sao simplesmente estupidos! 

16.9 CONTINUAQAO DA ANALISE 
LOGLINEAR © 

Uma maneira alternativa de interpretar uma 
intera 9 ao de tres fatores e conduzir uma analise 
qui-quadrado em diferentes nlveis de uma das 
variaveis. Por exemplo, para interpretar nossa 
intera 9 ao animal x treinamento x dan 9 a, pode- 
mos executar um teste qui-quadrado em treina¬ 
mento e dan 9 a, mas faze-lo separadamente para 
caes e gatos (a analise para gatos sera a mesma 
que do exemplo usado para o qui-quadrado). 
Voce pode, entao, comparar os resultados nos 
diferentes animais. Tente fazer isso usando o 
comando de divisao de arquivo (veja a Se 9 ao 
3.4). Os resultados e a interpreta 9 ao para ga¬ 
tos estao na Saida 16.2 do SPSS e para caes os 
resultados estao apresentados na Saida 16.11 
do SPSS. Para caes existe ainda um relaciona- 
mento significativo entre tipos de treinamento 
e se dan 9 aram ou nao, mas nao e tao forte (o 
qui-quadrado e 3,93 comparado com 25,2 dos 
gatos) 5 .Isso se reflete no fato de que caes tem 
uma probabilidade maior de dan 9 ar se ganha¬ 
rem afeto do que comida: o oposto dos gatos! 


5 A estatistica qui-quadrado depende do tamanho da 
amostra, desse modo, voce realmente precisa calcular 
os tamanhos dos efeitos e compara-los para fazer esse 
tipo de afirmaqao (a nao ser que voce tenha um numero 
igual de caes e gatos!). 
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Eles Dangaram? 
I | Sim 
I I Nao 


Gato Cao 




Tipo de treinamento 

Figura 16.7 Categorias expressas em percentual. 


Tipo de treinamento 


Saida 16.11 do SPSS 

Chi-Square Tests c (Testes Qui-quadrado) 



Value 

(Valor) 

df 

<gi) 

Asymp. 
Sig. (Sig. 
Assintotica) 

Exact Sig. 
(2-sided) (Sig. 
Exata - Bilateral) 

Exact Sig. 
(1-sided) (Sig. 
Exata Unilateral) 

Pearson Chi-Square (Qui-quadrado de Pearson) 

3.932 b 

1 

0.047 



Continuity Correction ‘ (Corregao de continuidade) 

2.966 

1 

0.085 



Ulelihood Ratio (Razao de verossimilhanga) 

3.984 

1 

0.046 



Fisher's Exact Test (Teste Exato de Fisher) 




0.068 

0.042 

Linear-by-LinearAssociation (Associagao Linear- 

3.876 

1 

0.49 



por-Linear) 






N of Valid Cases (Casos Validos) 

70 






a Calculado somente para tabelas 2x2. 

b. 0 celulas (0%) term valor esperado menor do que 5. A contagem minima esperada e 10,20. 

c. Animal = Cao. 


16.10 TAMANHOS DE EFEITO NA 
ANALISE LOGLINEAR © 

Como com o qui-quadrado de Pearson, 
uma das maneiras mais elegantes de relatar 
seus efeitos e em termos de razao de chan¬ 


ces. E mais facil entender a razao de chances 
para tabelas de contingencia 2 x 2 e, assim, 
se voce tiver interagoes significativas de alta 
ordem ou suas variaveis tern mais do que duas 
categorias, tente desmembrar esses efeitos 
em tabelas logicas 2 x 2 e calcular a razao 
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de chances que reflete a natureza da intera 9 ao. 
Assim, para esse exemplo podemos calcular a 
razao de chances para caes e gatos separada- 
mente. Ja temos a razao de chances para gatos 
(Segao 16.4.5) e para caes, temos: 


numero dos 
que comeram 

nu _ e dancaram 

V^IlcinCCSDangar apos comer = ” " 

numero dos que 
comeram mas 
nao dangaram 

20 
_ 14 
= 1,43 

numero dos que 
ganharam afeto 

nu e dancaram 

L^nanCeSDan^ar apos afeto — ” ' 

numero dos que 
ganharam afeto 
mas nao dancaram 
_ 29 
~ 7 
= 4,14 


Razao de chances = 


Chancesoangar apos comer 

Chances Dan?ai . a p6s afeto 


_ 1,43 
_ 4,14 
= 0,35 


Isso nos diz que se um cao foi treinado com 
comida ele teve 0,35 mais probabilidade de 
dangar (isto e, ele teve menos probabilidade de 
danijar). Outra maneira de dizer isso e que foi 
1/0,35 = 2,90 vezes menos provavel de dangar. 
Compare isso com gatos que tiveram 6,65 mais 
probabilidades de dan^ar. Como voce pode ver, 
comparar a razao das chances entre caes e gatos 
e uma maneira elegante de apresentar o termo 
de intera^ao de tres fatores no modelo. 


16.11 RELATAND0 OS RESULTAD0S DA 
ANALISE LOGLINEAR © 

Quando relatar a analise linear, voce pre- 
cisa informar a estatistica da razao de verossi- 


milhanca para o modelo final, geralmente indi- 
cado por x~. Para qualquer termo significativo 
voce deve relatar a mudanca do qui-quadrado 
ou voce deve relatar o escore-z para o efeito e 
seu intervalo de confianga associado. Se voce 
precisar desmembrar uma interacao de alta 
ordem em analises subsequentes, obviamente 
voce precisa relatar a estatistica qui-quadrado 
relevante (e a razao de chances). Para esse 
exemplo podemos relatar: 

/ A analise loglinear de tres fatores produ- 
ziu um modelo final que retem todos os 
efeitos. A razao de verossimilhanga desse 
modelo foi x 2 (0) = 0, p = 1. Isso indicou 
que a interagao de mais alta ordem (a inte- 
ragao animal x treinamento x danga) foi 
significativa x 2 (l) = 20,31 p < 0,001. Para 
desmembrar esse efeito, separe os testes 
do qui-quadrado das variaveis treinamen¬ 
to e dan^a que foram realizadas separada- 
mente para caes e gatos. Para gatos, houve 
uma associado significativa entre o tipo de 
treinamento e se os gatos dancaram ou nao, 
X 2 (l) = 25,36 p < 0,001; isso foi verdadeiro 
para caes tambem, x 2 (l) = 3,93 p < 0,05. 
A razao das chances indicou que gatos ti- 
nham 6,65 mais chances de dan^ar se trei- 
nados com comida do que treinados com 
afeto, mas caes tinham somente 0,35 mais 
chances de dangar (ou 2,90 vezes menos 
probabilidade de dangar). Portanto, a ana¬ 
lise revela uma diferen^a fundamental entre 
caes e gatos: gatos tern uma probabilidade 
maior de dan 5 ar por comida do que por afe¬ 
to e caes tern uma probabilidade maior de 
dan 9 ar por afeto do que por comida. 

16.12 0 QUE DESC0BRIM0S S0BRE 
ESTATISTICA? © 

Na primeira edi 9 ao deste livro, queria 
escrever um capitulo sobre analise loglinear, 
mas ja havia escrito 300 paginas a mais do que 
o combinado e tinha despendido tanto esfor 90 
no restante do livro que pensar em mais um 
capitulo era imposslvel. Desta vez, decidi que 
escreveria um capitulo sobre a analise logli¬ 
near. Entretanto, quando chegou o momenta. 
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• Se voce quer testar o relacionamento entre mais do que duas variaveis cate- 
goricas, pode fazer isso com a analise loglinear. 

• A analise loglinear e hierarquica: o modelo inicial contem todos os efeitos 
principals e interagoes. Iniciando com a interagao de alta ordem, os termos 
sao removidos para ver se sua remogao afeta de modo significativo o ajuste 
do modelo. Se ela afeta, esse termo nao e removido e todos os efeitos de 
baixa ordem sao ignorados. 

• Olhe para a tabela The Best model has generating class (0 melhor modelo 
tern uma classe geradora) para ver quais efeitos ficaram retidos no modelo 
final. Consulte a tabela If Deleted Simple Effect is (Se o efeito simples elimina- 
do e) para ver a significance individual dos efeitos retidos (olhe para a coluna 
Prob: valores menores do que 0,05 indicam significance). 

• Olhe para as estatisticas teste de aderencia para o modelo final: se o modelo 
se ajusta bem aos dados, essa estatistica deve ser nao-significativa (Prob. 
deve ser maior do que 0,05). 

• Olhe para a tabulagao cruzada a fim de interpretar qualquer efeito significativo 
(% do total das celulas e o melhor fator para consultar). 


havia escrito 200 paginas a mais do que de- 
veria para essa nova edicao e, com o prazo 
encurtando, a historia estava se repetindo. 
Portanto, voce nao sabe como estou muito 
feliz de ter finalmente escrito esta droga de 
capitulo! Este capftulo forneceu uma breve 
visao sobre a analise de dados categoricos. 
Mostrei que abordamos dados categoricos da 
mesma maneira que qualquer outro tipo de da¬ 
dos: ajustamos o modelo, calculamos o desvio 
entre nosso modelo e os dados observados e 
usamos isso para avaliar o modelo que ajus¬ 
tamos. Tambem tentei ensinar que o modelo 
que ajustamos e o mesmo que vimos ao longo 
de todo o livro: o modelo linear (regressao). 
Quando temos somente duas variaveis, pode- 
mos usar o teste qui-quadrado de Pearson ou o 
teste da razao de verossimilhanga para ver se 
as duas variaveis estao associadas. Em situa¬ 
tes mais complexas, simplesmente estende- 
mos esses modelos para algo conhecido como 
modelo loglinear. Isso e parecido com a ANO- 
VA para dados categoricos: para cada variavel 
que temos, obtemos um efeito principal, mas 
tambem obtemos interagoes entre variaveis. 
A analise loglinear avalia todos esses efeitos 
hierarquicamente para nos dizer quais deles 
preveem melhor nossa safda. 


16.13 TERM0S-CHAVE QUE 
DESC0BRIM0S 

• Variavel Categorica 

• Teste qui-quadrado 

• Tabela de contingencia 

• O V de Cramer 

• O A, de Goodman e Kruskal 

• Analise Loglinear 

• Razao de chances 

• Fi 

• Modelo saturado 

• Corregao de continuidade de Yates 

16.14 TAREFAS DO ALEX ESPERT0 



Tarefa 1: Alguns editores das 
Sage Publications acham que 
sabem tudo sobre futebol. Para 
ver se eles sao melhores do que 
os professores de Sussex e alu- 
nos da pos-graduagao, convidamos varios 
funcionarios da Sage para participarem dos 
nossos jogos de futebol (quero dizer, nos os 
convidamos para importantes reunioes so¬ 
bre livros). Cada jogador poderia jogar so¬ 
mente uma partida. Ao longo das partidas, 
contamos o numero de jogadores que mar- 
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caram gols. Os dados estao no arquivo 
SageEditorsCan’tPlayFootball.sav; faca 
o teste qui-quadrado para ver quem marcou 
mais gols: editores ou academicos. Nossa 
hipotese e que o time de Sussex ira marcar 
mais do que o da Sage. © 

• Tarefa 2: Queria verificar se o horosco- 
po e somente uma invcncao da cabe^a das 
pessoas. Portanto, peguei 2201 pessoas, 
anotei seus signos (essa variavel, obvia- 
mente, tern 12 categorias: Capricornio, 
Aquario, Peixes, Aries, Touro, Gemeos, 
Cancer, Leao, Virgem, Libra, Escorpiao e 
Sagitario) e se elas acreditavam em horos- 
copos (essa variavel tem duas categorias: 
crente ou nao-crente). Depois, enviei um 
horoscopo para elas com a informacao do 
que iria acontecer durante o proximo mes: 
todas, independentemente do seu signo, 
receberam o mesmo horoscopo, que di- 
zia: “Agosto e um otimo mes para voce. 
Voce ira fazer amizade com um vagabun- 
do na primeira semana do mes e fara uma 
omelete de queijo para ele. A curiosidade 
e sua grande virtude e, na segunda sema¬ 
na, voce ira se interessar por um assunto 
que antes julgava entediante, estatistica, 
talvez. Talvez voce compre um livro nes- 
sa mesma semana que o guiara em dire- 
cao a essa sabedoria. Seu novo conheci- 
mento o fara mudar de carreira por volta 


da terceira semana, quando voce largara o 
seu emprego e se tornara contador. Na ul¬ 
tima semana, voce nao tera mais amigos, 
sua namorada(o) te abandonara por um(a) 
dangarino(a) russo(a) de bale com um 
olho de vidro e voce passara seus finais de 
semana fazendo analise loglinear a mao 
com a companhia de um pombo chamado 
Hephzibah”. No final de agosto, entrevis- 
tei todas as pessoas em rela^ao a como 
suas vidas combinaram com o horoscopo 
fictfcio e classifiquei o horoscopo como 
verdadeiro ou falso. Os dados estao no ar¬ 
quivo Horoscope.sav. Realize uma anali¬ 
se loglinear para ver se existe um relacio- 
namento entre o signo da pessoa, se eles 
acreditam em horoscopo e se o horoscopo 
foi verdadeiro. 

As respostas podem ser encontradas 

no site www.artmed.com.br no arquivo 

Answers(Chapterl6).pdf. 

16.15 LEITURAS COMPLEMENTARES 

HUTCHESON, G., SOFRONIOU, N. The 
multivariate social scientist. London: Sage, 
1999. 

TABACHNICK, B. G., FIDELL, L. S. Using 
multivariate statistics. Boston: Allyn e Bacon. 
2001. 4“ ed. O Capftulo 7 sobre Analise 
Loglinear e muito bom. 
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EPILOGO 


Eis algumas perguntas que o autor enviou 
Urn observadorpode ser umparticipante? 

Eu tenho visto demais? 
E vdlido se ndo posso tocar? 
Se a visao e tudo o que eu posso assegurar 
O entendimento estdfora do alcance. 

(Fugazi, 2001) 


Entao, voce chegou ao final do livro, hein? 
Se voce leu o livro de cabo a rabo, investiu 
grande parte da sua vida (possivelmente toda 
a sua vida, a nao ser que voce seja um leitor 
rapido) neste livro e eu estou lisonjeado. Voce 
deve ter aprendido algo sobre estatistica (se 
nao, eu certamente aprendi muito escrevendo 
o livro), mas o mais importante e que tivemos 
nossa parte justa de sexo, drogas e rock’n’roll 
(em exemplos, obviamente). 

Um dos grandes problemas em ser apaixo- 
nado por lecionar e que voce constantemente se 
da conta de como e um pessimo professor. O 
dia em que eu obtive a copia da primeira edigao 
deste livro eu estava muito entusiasmado: o abri 
para admirar meu trabalho e a primeira coisa 
que encontrei foi um erro! Era um erro peque- 
no, mas desde entao tenho encontrado imperfei- 
goes irritantes. Assim, quando os editores deci- 
diram que queriam uma nova versao eu pensei 
“otimo”, agora posso escreve-lo corretamente e 
acrescentar todas as coisas que as pessoas me 
perguntam. Obviamente, fiquei obsessivo com 
isso e, quase 700 paginas depois, espero nunca 
mais ter que escrever outra palavra sobre esta¬ 
tistica novamente! Assim, se voce enviasse o se- 


guinte modelo de carta a Michael Carmichael, 
a/c Sage Publications, eu ficaria muito grato. 

Prezado Sr. Carmichael 

Estou escrevendo para dizer que comprei 
o livro de Andy Field, Descobrindo Estatisti¬ 
ca Usando o SPSS, e achei-o perfeito. Se voce 
for publicar uma terceira edigao, pego que 
nao mude uma unica palavra, apenas crie uma 
nova capa e pague alguem, que nao o Andy, 
para atualizar o SPSS. Mudar uma palavra, 
mesmo que pequena, seria um crime hediondo 
e iria colocar em risco todas as futuras vendas 
deste livro. Nao e justo, tambem, que um ho- 
mem tao legal como o Andy tenha que traba- 
lhar para que os amigos dos editores possam 
passear por Londres em limusines, bebendo 
champanhe e cheirando coca; voce deveria dar 
mais dinheiro para ele e pagar por umas ferias 
bem longas, as quais ele, com certeza, merece 
apos todo esse trabalho arduo. 

Atenciosamente, 

(coloque seu nome aqui) 

Cliente valorizado 




GLOSSARIO 


Este glossario content definigoes breves de todos 
os termos-chave do livro. Palavras em italico 
referem-se a itens que estao definidos em outros 
locais do glossario 


-2LL: a verossimilhanga log multiplicada por me- 
nos 2. Essa versao da verossimilhanga e utilizada 
na regressao loglstica. 

Aderencia: um rndice de quao bem um modelo se 
ajusta aos dados a partir do qual ele foi gerado. E 
normalmente baseado em quao bem os dados pre- 
vistos pelo modelo correspondem aos dados que 
foram de fato coletados. 


AFD: um acronimo para Analise da Fungao Dis- 
criminante (ver Analise Discriminante). 


Aleatorizagao: o processo de fazer coisas de uma 
maneira nao-sistematica ou aleatoria. No contexto 
da pesquisa experimental, a palavra, em geral, se 
aplica a atribuigao ao acaso dos participantes as 
diferentes condigoes do tratamento. 


Alfa (a) de Cronbach: uma medida de confiabili- 
dade de uma escala definida por: 


N 2 Cov 


it 


pela covariancia media entre os itens (a media 
dos elementos fora da diagonal na matriz das va- 
riancias-covariancias). O denominador e a soma 
de todos os elementos da matriz das variancias- 
covaridncias. 

Amostra: uma pequena (mas com sorte represen- 
tativa) colegao de unidades de uma populagao, 
usada para determinar verdades sobre essa popu- 
lagao (por exemplo, como uma dada populagao se 
comporta em determinadas condigoes). 

Analise de covariancia: um procedimento estatfs- 
tico que utiliza a razao F para testar a aderencia de 
um modelo linear controlando o efeito que uma ou 
mais covaridveis apresentam sobre os resultados 
da varidvel salda. Na pesquisa experimental, esse 
modelo linear tende a ser definido em termos das 
medias dos grupos, e a ANOVA resultante e, dessa 
forma, um teste global se a media dos grupos dife- 
re apos a variancia na varidvel salda explicada por 
qualquer covaridvel ter sido removida. 

Analise de fatores: uma tecnica multivariada para 
identificar se a correlagao entre um conjunto de 
variaveis observadas e devido ao relacionamento 
com uma ou mais variaveis latentes existentes nos 
dados, cada uma das quais assumindo a forma de 
um modelo linear. 


em que o numerador da equagao e simplesmente Analise de Fatores Confirmatoria (AFC): uma 
o numero de itens (N) ao quadrado multiplicado versao da analise de fatores em que hipoteses 
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especfficas sobre a estrutura e relagoes entre as 
varidveis latentes subjacentes aos dados sao tes- 
tadas. 

Analise de variancia multivariada: famflia de 
testes que estende a analise de variancia basica a 
situagoes nas quais mais do que uma variavel de 
safda foi mensurada. 

Analise de variancia: um procedimento estatfs- 
tico que utiliza a razao F para testar a aderencia 
de um modelo linear. Na pesquisa experimental, 
esse modelo linear tende a ser definido em termos 
da media do grupo e a ANOVA resultante e, dessa 
forma, um teste global para verificar se as medias 
dos grupos diferem. 

Analise discriminante: tambem conhecida como 
analise da fungao discriminante. Essa analise 
identifica e descreve a fungao discriminante de 
um conjunto de variaveis (combinagao linear de 
variaveis) e e utilizada para dar seguimento a um 
teste MANOVA como uma forma de ver como o 
conjunto de variaveis permite discriminar o con- 
junto de casos. 

Analise dos componentes principals (ACP): 

uma tecnica multivariada para identificar os com¬ 
ponentes lineares de um conjunto de variaveis. 

Analise dos efeitos simples: Essa analise observa 
os efeitos de uma variavel independente (variavel 
previsora categorica) em nfveis individuals de ou- 
tra variavel independente. 

Analise Loglinear: um procedimento usado como 
uma extensao do teste qui quadrado para analisar 
situagoes nas quais voce tern mais do que duas va¬ 
ridveis categdricas e voce quer testar os relaciona- 
nientos entre essas variaveis. Essencialmente, um 
modelo linear e ajustado aos dados que preveem 
frequencias esperadas (isto e, o numero de casos 
esperados numa categoria dada). A esse respeito, 
e quase o mesmo que a analise de variancia, mas 
para dados totalmente categoricos. 

ANCOVA: acronimo de analise de covariancia. 

ANOVA de Friedman: um teste nao-parametrico 
para verificar se dois ou mais grupos diferem. E 
a versao nao-parametrica da ANOVA de medidas 
repetidas de um fator. 


ANOVA de medidas repetidas: uma analise da 
variancia conduzida em qualquer delineamento no 
qual a variavel independente (previsora) ou as va¬ 
ridveis (previsoras) foram mensuradas usando os 
mesmos participantes em todas as condigoes. 

ANOVA Fatorial: uma analise de variancia en- 
volvendo duas ou mais varidveis independentes ou 
previsores. 

ANOVA independente: analise da variancia con¬ 
duzida em qualquer delineamento no qual varid¬ 
veis independentes ou previsores foram manipula- 
das usando participantes diferentes (isto e todos os 
dados vem de entidades diferentes). 

ANOVA Mista: analise de variancia usada quan- 
do voce tern um delineamento misto. 

ANOVA: acronimo para analise de variancia. 

Assimetria negativa: veja assimetria. 

Assimetria positiva: veja assimetria. 

Assimetria: uma medida da simetria de uma dis- 
tribuigao de frequencias. Distribuigoes simetricas 
tem um coeficiente de assimetria igual a 0. Quan- 
do a maioria dos escores esta concentrada no final 
da distribuigao e a cauda aponta na diregao do 
escore mais alto ou positivo, a assimetria e positi¬ 
va. Contrariamente, quando a maioria dos escores 
esta concentrada na parte final da distribuigao e a 
cauda aponta na diregao dos escores mais baixos 
ou negativos, a assimetria e negativa. 

Autocorrelagao: quando os resfduos de duas 
observagoes num modelo de regressao sao corre- 
lacionados. 

bp coeficiente de regressao nao-padronizado. 
Indica a for^a do relacionamento entre um dado 
previsor, i, e uma safda em unidades de medidas 
do previsor. Ele e a mudanga na safda associada a 
mudanga de uma unidade no previsor. 

Iip coeficiente de regressao padronizado. Indica a 
forga do relacionamento entre um dado previsor, i, 
e uma safda de forma padronizada. Ele e a mudan- 
ga na safda (em desvios padrao) associada a uma 
alteragao de um desvio padrao no previsor. 

Bimodal: uma descrigao de uma distribuigao de 
observagoes que apresenta duas modas. 
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Carga de um fator: o coeficiente de regressao de 
uma variavel para o modelo linear que descreve a 
variavel latente ou fator na andlise defatores. 


enquanto uma variavel que nada compartilha de 
sua variancia com qualquer outra variavel tera uma 
comunalidade de 0. 


Chance: a probabilidade de um evento ocorrer 
dividido pela probabilidade daquele evento nao 
ocorrer. 

Chorar: e o que voce faz depois de escrever um 
livro de estatistica. 

Coeficiente de correlagao de Pearson: tambem 
chamado de coeficiente de correlacao momento- 
produto de Pearson, e uma medida padronizada da 
forga do relacionamento entre duas variaveis. Ele 
pode ter qualquer valor de — 1 (a medida que uma 
variavel muda, a outra muda na diregao oposta 
pela mesma quantia) passando por 0 (a medida 
que uma variavel muda, a outra nao muda) ate +1 
(a medida que uma variavel muda, a outra muda na 
mesma diregao pela mesma quantia). 

Coeficiente de correlacao de Spearman: uma 

medida padronizada da forga do relacionamento 
entre duas variaveis que nao depende das hipoteses 
de um teste parametrico. Ele e o coeficiente de 
correlagao de Pearson calculado para dados que 
foram convertidos em postos. 


Confiabilidade meio a meio: uma medida de con- 
fiabilidade obtida dividindo os itens de uma me¬ 
dida em duas metades (de uma maneira aleatoria) 
e obtendo um escore de cada metade da escala. A 
correlagao entre os dois escores, corrigidos levan- 
do em consideragao o fato de que as correlagoes 
sao baseadas em somente a metade dos itens, e 
usada como uma medida da confiabilidade. Exis- 
tem duas maneiras de fazer isso. Spearman (1910) 
e Brown (1910) desenvolveram uma formula que 
nao precisa do desvio padrao entre os itens: 


Psh 


2r n 

1 + l'l 2 


onde r n e a correlagao entre as duas metades da 
escala. Flanagan (1937) e Rulon (1939), entretan- 
to, propuseram uma medida que leva em conside¬ 
ragao a variancia dos itens: 

4/'i2 X Si X S2 
P\h Z 

St 


Coeficiente de determinagao: a proporgao da 
variancia em uma variavel explicada pela segunda 
variavel. Ele e o coeficiente de correlagao de Pe¬ 
arson elevado ao quadrado. 

Coeficiente de regressao: veja b, e fi. 

Colinearidade perfeita: existe quando pelo me- 
nos um previsor num modelo de regressao e uma 
combinagao linear perfeita de outros (o exemplo 
mais simples sendo dois previsores que sao perfei- 
tamente correlacionados - eles tern um coeficiente 
correlagao de 1). 


no qual Sj e s 2 sao desvios padrao de cada metade 
da escala e S 2 T e a variancia de todo o conjunto. 
Veja Cortina (1993) para mais detalhes. 

Confiabilidade Teste-Reteste: a habilidade de 
uma mensuragao produzir resultados consistentes 
quando as mesmas entidades sao testadas em dois 
pontos diferentes no tempo. 

Confiabilidade: a habilidade de uma medida pro¬ 
duzir resultados consistentes quando as mesmas 
entidades estao sendo mensuradas sob as mesmas 
condigoes. 


Comparagoes pareadas: comparagoes de pares 
de medias. 

Comparagoes Planejadas: outro nome para con- 
trastes planejados. 

Comunalidade: a proporgao da variancia de uma 
variavel que e comum. Esse termo e utilizado 
principalmente na andlise defatores. Uma va¬ 
riavel que nao tem uma variancia exclusiva (ou 
variancia aleatoria) tera uma comunalidade de 1, 


Contrabalanceamento: o processo de sistemati- 
camente variar a ordem em que condigoes expe- 
rimentais sao conduzidas. No caso mais simples, 
de existirem duas condigoes (A e B), o contra¬ 
balanceamento implica que metade dos partici- 
pantes submete-se a condigao A e em seguida a 
condigao B, enquanto os restantes submetem-se 
a condigao B seguida da A. O objetivo e remover 
tendenciocidades causadas por efeitos praticos ou 
de tedio. 
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Contraste diferenga: um contrasteplanejado 
nao-ortogonal que compara a media de cada con- 
digao (exceto a primeira) com a media global de 
todas as condigoes anteriores combinadas. 

Contraste Helmert: um contraste planejado nao- 
ortogonal que compara a media de cada condigao 
(exceto a ultima) a media geral de todas as condi¬ 
goes subsequentes combinadas. 

Contraste polinomial: um contraste que testa 
por tendencias nos dados. Na sua forma mais 
basica, ele procura por uma tendencia linear (isto 
e, que as medias dos grupos aumentam propor- 
cionalmente). 

Contraste repetido: um contraste planejado 
nao-ortogonal que compara as medias em cada 
condigao (exceto a primeira) a media da condigao 
precedente. 

Contraste reverso de Helmert: outro nome para 
um contraste diferenga. 

Contraste simples: um contraste planejado nao- 
ortogonal que compara a media em cada condigao 
a media da primeira ou ultima condigao dependen- 
do em como o contraste for especificado. 

Contrastes planejados: um conjunto de com- 
paragoes entre grupos de medias projetado antes 
que qualquer dado seja coletado. Sao compara- 
goes teoricas baseadas na ideia de particionar a 
variancia criada pelo efeito geral das diferengas 
dos grupos gradualmente em pequenas porgoes da 
variancia. Esses testes tem mais poder do que os 
testes post hoc. 

Corregao continua de Yates: um ajuste feito para 
o teste qui-quadrado quando a tabela de contin- 
gencia e duas linhas por duas colunas (isto e, exis¬ 
tent duas variaveis categoricas, ambas consistindo 
em apenas duas categorias). Em amostras grandes, 
o ajuste faz pouca diferenga e e levemente duvido- 
so (veja Howell, 2002). 

Corregao de Bonferroni: uma corregao aplicada 
ao mvel a para controlar a taxa de erro do Tipo I 
global quando varios testes de significancia sao 
executados. Cada teste conduzido deve utilizar um 
criterio de significancia de nivel a (normalmente 
0,05) dividido pelo numero de testes realizados. 
Essa e uma corregao simples, porem efetiva, mas 


tende a ser muito rfgida quando muitos testes sao 
executados. 

Corregao de Greenhouse e Geisser: uma esti- 
mativa do afastamento da esfericidade. O valor 
maximo e 1 (os dados atendem completamente a 
hipotese de esfericidade) e o minirno e o limite in¬ 
ferior. Valores abaixo de 1 indicam distanciamento 
da esfericidade e sao utilizados para corrigir os 
graus de liberdade associados a correspondente 
razao F multiplicando o seu valor pelo da estima- 
tiva. Alguns dizem que a corregao de Greenhouse 
e Geisser e muito conservadora (estrita) e reco- 
mendam a corregao de Huynh-Feldt. 

Corregao de Huynh-Feldt: uma estimativa do 
desvio da esfericidade. O valor maximo e 1 (os 
dados atendem completamente a hipotese da es¬ 
fericidade). Valores abaixo desse indicam desvios 
da esfericidade e sao utilizados para corrigir os 
graus de liberdade associados as razoes F corres- 
pondentes multiplicando-as pelo valor da estima¬ 
tiva. E menos conservador do que a estimativa de 
Greenhouse e Geisser , mas alguns dizem que ela e 
muito liberal. 

Corregao Sidak: uma variante levemente menos 
conservadora da corregao de Bonferroni. 

Correlagao bisserial: uma medida padronizada 
da forga do relacionamento entre duas variaveis 
quando uma das duas e dicotdmica. O coeficiente 
de correlagao bisserial e utilizado quando uma 
variavel e dicotomica continua (isto e, tem um 
continuo subjacente entre as categorias). 

Correlagao bivariada: uma correlagao entre duas 
variaveis. 

Correlagao parcial: uma medida do relaciona¬ 
mento entre variaveis “controlando” o efeito que 
uma ou mais variaveis adicionais podem ter em 
ambas. 

Correlagao ponto bisserial: uma medida pa- 
drao da forga do relacionamento entre duas 
variaveis quando uma das duas variaveis e dico¬ 
tdmica. O coeficiente de correlagao ponto bis¬ 
serial e usado quando a dicotomia e discreta ou 
verdadeira (isto e, quando nao ha um continuum 
subjacente entre as categorias). Um exemplo 
disso e a gravidez: a mulher esta ou nao gravida, 
nao ha meio termo. 
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Correlaqao por partes: outro nome para uma 
correlaqao semiparcial. 

Correlaqao semiparcial: uma medida do rela- 
cionamento entre duas variaveis “controlando” o 
efeito que uma ou mais variaveis tern sobre uma 
dessas variaveis. Se nomearmos nossas variaveis 
x e v, ele fornece uma medida da variancia em v 
compartilhada apenas com x. 

Corridas de Wald-Wolfowitz: outra variante do 
teste de Mann-Whitney. Os escores sao ordenados 
como no teste de Mann-Whitney, mas em vez de 
analisar as classificaqoes esse teste procura por 
“corridas” de escores do mesmo grupo dentro de 
uma determinada ordem. Agora, se nao houver di- 
ferenqa entre os grupos, obviamente classificaqoes 
dos dois grupos devem ser entremeadas aleato- 
riamente. Entretanto, se os grupos sao diferentes, 
voce deve ver mais postos de um grupo na parte 
inferior e mais postos de outro grupo na parte su¬ 
perior. Procurando aglomerados de escores dessa 
maneira, o teste pode determinar se os grupos 
diferem. 

Covariancia: uma medida do relacionamento 
medio entre duas variaveis. E o produto cruzado 
medio (isto e, o produto cruzado dividido pelo nu- 
mero de observaqoes menos um). 

Covariavel: a variavel que tern um relacionamen¬ 
to com (em termos de covariancia ) ou tern o po- 
tencial de estar relacionada a variavel de saida que 
esta sendo mensurada. 

Criterio de Kaiser: um metodo de extraqao na 
analise defatores baseado na ideia de reter fatores 
com autovalores associados maiores do que 1. 

Esse metodo parece ser preciso quando o nume- 
ro das variaveis na analise e menor do que 30 e 
as comunalidades resultantes (apos a extraqao) 
sao maiores do que 0,7; ou quando o tamanho da 
amostra excede a 250 e a media da comunalidade 
e maior ou igual a 0,6. 

Curtose: mensura o grau em que os escores se 
amontoam nas caudas de uma distribuiqao de 
frequencias. Uma distribuiqao platicurtica e uma 
que tem muitos escores nas caudas e, assim, e bem 
plana. Em contraste, as distribuiqoes leptocurticas 
sao relativamente frnas nas caudas, portanto, pare- 
cem bem pontudas. 


Dados de razao: dados intervalares, mas com a 
propriedade adicional de que as razoes apresentam 
significados. Por exemplo, as avaliaqoes das pes- 
soas para este livro na Amazon.com podem variar 
de 1 a 5; para esses dados serem de razao, eles 
nao somente devem ter as propriedades dos dados 
inten’alares, mas tambem uma avaliaqao de 4 deve 
representar genuinamente alguem que apreciou 
este livro duas vezes mais do que alguem cuja ava- 
liaqao foi 2. Da mesma forma, alguem que avaliou 
o livro com 1 deve estar apenas meio impressiona- 
do em relaqao a alguem cuja avaliaqao foi 2. 

Dados intervalares: dados mensurados numa es- 
cala ao longo da qual os intervalos sao iguais. Por 
exemplo, as avaliaqoes das pessoas sobre este livro 
naAmazon.com podem variar de 1 a 5; para esses 
dados serem intervalares, deve ser verdade que o 
aumento da avaliaqao deste livro de 1 para 2 deva 
ser o mesmo que um aumento de 4 para 5. 

Dados nominais: onde os numeros apenas repre- 
sentam nomes, por exemplo, os nomes nas cami- 
setas dos jogadores: umjogador com o numero 1 
nas costas nao e necessariamente pior do que um 
jogador com um 2 nas suas costas. Os numeros 
nao tem outro significado do que representar o tipo 
de jogador (isto e, zagueiro, centro-avante, etc.). 

Dados ordinais: dados que nos informam o que 
aconteceu e tambem a ordem em que ocorreu. Es¬ 
ses dados nao dizem nada sobre as diferenqas en¬ 
tre os valores. Por exemplo, as medalhas de ouro, 
prata e bronze sao ordinais: elas nos dizem que o 
medalhista de ouro foi melhor do que o medalhista 
de prata; entretanto, eles nao nos dizem quanto 
melhor (o competidor de ouro foi muito melhor 
do que o de prata ou os resultados foram muito 
proximos?). 

Delineamento de medidas repetidas: um de- 

lineamento experimental em que diferentes 
condiqoes de tratamento utilizam os mesmos 
organismos (isto e, em psicologia isso significaria 
que todas as pessoas tomariam parte em todas as 
condiqoes experimentais), assim, os dados resul¬ 
tantes sao relacionados (tambem conhecido como 
relacionamentos ou delineamentos entre sujeitos). 

Delineamento entre sujeitos: outro nome para 
delineamento de medidas repetidas. 
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Delineamento entre grupos: outro nome para o 
delineamento independente. 

Delineamento entre participantes: outro nome 
para o delineamento independente. 

Delineamento fatorial independente: um deli¬ 
neamento experimental com dois ou mais previ- 
sores (ou varidveis independentes) em que todos 
foram manipulados usando diferentes participantes 
(ou qualquer entidade sendo testada). 

Delineamento fatorial relacionado: um delinea- 
niento experimental incorporando dois ou mais 
previsores (ou varidveis independentes), onde 
todos foram manipulados usando os mesmos par¬ 
ticipantes (ou qualquer entidade que esteja sendo 
testada). 

Delineamento independente: um delineamento 
experimental no qual condigoes diferentes de 
tratamento utilizam diferentes organismos (por 
exemplo, em psicologia isso significaria pessoas 
diferentes em condigoes de tratamento distintas), 
assim, os dados resultantes sao independentes 
(tambem conhecido como delineamento entre 
grupo ou delineamento entre participantes ou su- 
jeitos). 

Delineamento misto: um delineamento experi¬ 
mental incorporando dois ou mais previsores (ou 
varidveis independentes), onde pelo menos um 
foi manipulado usando participantes diferentes 
(ou qualquer entidade que esteja sendo usada) e 
pelo menos um foi manipulado usando os mesmos 
participantes (ou entidades). Tambem conhecido 
como um delineamento por divisao em lotes (split- 
plot) porque Fisher desenvolveu a ANOVA para 
analisar dados agricolas envolvendo lotes de terra 
contendo cultivos. 

Delineamento relacionado: outro nome para um 
delineamento de medidas repetidas. 

Desvio padrao: uma estimativa da variabilidade 
media (espalhamento) de um conjunto de dados 
mensurado na mesma unidade de mensuragao 
dos dados originais. Ele e a raiz quadrada da 
variancia. 

Desvios dos contrastes: um contraste 
nao-ortogonal planejado que compare as medias 
de cada grupo (exceto a primeira e a ultima de- 


pendendo de como o contraste e planejado) com a 
media global (medias de todas as medias). 

DFBeta padronizado: uma versao padronizada 
do DFBeta. Esses valores padronizados sao mais 
faceis de usar do que o proprio DFBeta porque 
pontos de corte universais podem ser aplicados. 
Stevens (1992) sugere observar casos com valores 
absolutos maiores do que 2. 

DFBeta: uma medida da influencia de um caso 
nos valores de b t em um modelo de regressao. Se 
estimarmos um parametro de regressao b t e elimi- 
narmos um caso (valor) especffico e estimarmos 
novamente o mesmo parametro de regressao b L a 
diferenga entre essas duas estimativas sera o DF¬ 
Beta para o caso que foi eliminado. Pelo exame 
dos valores do DFBeta, e posslvel identificar casos 
que tern uma grande influencia nos parametros 
do modelo de regressao; entretanto, o tamanho do 
DFBeta dependent da unidade de medida dos pa¬ 
rametros da regressao. 

DFFit padronizado: uma versao padronizada do 
DFFit. 

DFFit: uma medida da influencia de um caso. E a 
diferenga entre o valor previsto ajustado e o valor 
original previsto para um caso especffico. Se o 
caso nao exerce influencia, o DFFit deve ser zero, 
entretanto, espera-se que casos que nao exergam in¬ 
fluencia tenham pequenos valores DFFit. Existe um 
problema com essa estatlstica, pois ela depende das 
unidades de medida da variavel de salda e, assim, 
um DFFit de 0,5 sera pequeno se a salda variar de 0 
a 100, mas grande se ela variar apenas de 0 a 1. 

Diagrama de barras de erros: uma representagac 
grafica da media de um conjunto de observagdes 
que inclui o intervalo de 95% para a media. A 
media e normalmente representada como um 
ponto, quadrado ou retangulo estendendo o valor. 
O intervalo de confianga e representado por uma 
linha projetada da media (para cima, para baixo 
ou ambos) ate uma pequena linha horizontal re- 
presentando os limites do intervalo de conflanga. 
Barras de erro podem ser desenhadas utilizando o 
erro padrao ou desvio padrao em vez do intervalo 
de 95% de confianga. 

Diagrama de Caixa e Bigodes ( Boxplot ): uma re- 

presentagao grafica de algumas caracterlsticas im- 
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portantes de um conjunto de observagoes. No cen¬ 
tra do diagrama esta a mediana, que e rodeada por 
um retangulo (caixa), onde as arestas superior e in¬ 
ferior sao os limites dentro dos quais encontram-se 
50% das observagoes (o intervalo interquartUico). 
A partir dos extremos dos retangulos existem duas 
linhas (os bigodes) que se estendem ate os valores 
extremos do conjunto respectivamente. 

Diagrama de declividade: um grafico tragando 
cada fator numa andlise defatores (eixo x) con¬ 
tra seu autovalor associado (eixo y). Ele mostra 
a importancia relativa de cada fator. Esse grafico 
tern uma forma muito caracterfstica (existe uma 
descida acentuada na curva seguida por uma 
cauda suave) e o ponto de inflexao dessa curva 
e geralmente usado como ponto de corte do nu¬ 
meral de fatores extraidos. Com uma amostra de 
mais de 200 participantes, ele fomece um criterio 
confiavel para a extragdo dos fatores (Stevens, 
1992). 

Diagrama de dispersao: um grafico que traga os 
valores de uma variavel contra o valor correspon- 
dente da outra variavel (o valor correspondente de 
uma terceira variavel pode tambem ser inclui'do 
num diagrama de dispersao tridimensional). 

Dicotomica: descrigao de uma variavel que con- 
siste em apenas duas categorias (por exemplo, a 
variavel genera e dicotomica porque ela e formada 
apenas pelas categorias masculino e feminino). 

Distancia de Cook: uma medida da influencia 
global de um caso (valor) em um modelo. Cook e 
Winberg (1982) sugeriram que valores superiores 
a 1 podem ser motivo de preocupagao. 

Distancia de Mahalanobis: mede a influencia de 
um caso examinando a distancia dos casos da(s) 
media(s) da(s) variavel(is) previsora(s). Voce 
deve buscar casos com valores altos. Nao e facil 
estabelecer um ponto de corte a partir do qual se 
preocupar, embora Barnett e Lewis (1978) produ- 
ziram uma tabela de valores crfticos dependendo 
do numero de previsores e do tamanho da amostra. 
Do seu trabalho esta claro que mesmo com gran- 
des amostras (N = 500) e cinco previsores, valores 
acima de 25 sao preocupantes. Em amostras me- 
nores (N = 100) e com poucos previsores (a saber, 
tres), valores maiores do que 15 sao problematicos 
e em amostras muito pequenas (N = 30) com so- 


mente dois previsores, valores maiores do que 11 
devem ser examinados. Entretanto, para um conse- 
lho mais especlfico, consulte a tabela de Barnett e 
Lewis (1978). 

Distribuigao amostral: a distribuigao de pro- 
babilidade de uma estatistica. Voce pode pen- 
sar nisso da seguinte forma: se tirarmos uma 
amostra de uma populagao e calcularmos uma 
estatistica (por exemplo, a media), o valor dessa 
estatistica ira depender de algum modo da amos¬ 
tra que tiramos. Assim, a estatistica ira variar 
levemente de amostra para amostra. Se, hipoteti- 
camente, tirarmos muitas amostras da populagao 
e calcularmos a estatistica de interesse, sera 
posslvel criar uma distribuigao de frequencia dos 
valores que conseguimos. A distribuigao resul- 
tante e o que a distribuigao amostral representa: 
a distribuigao de posslveis valores de uma esta¬ 
tistica que podemos esperar de uma determinada 
populagao. 

Distribuigao de frequencias: o conjunto de valo¬ 
res de uma variavel com as respectivas frequencias 
(absolutas ou relativas). Se a variavel e discreta, 
a distribuigao e apresentada em um diagrama de 
barras e se contlnua, em um histograma. Em qual- 
quer caso, a variavel e representada no eixo x e as 
frequencias sao representadas no eixo y. 

Distribuigao de probabilidade: o conjunto de 
todos os valores de uma variavel junto com as suas 
probabilidades, se a variavel for discreta, ou densi- 
dades, se a variavel for contlnua. 

Distribuigao normal: uma distribuigao de proba¬ 
bilidade de uma variavel aleatoria que se sabe ter 
certas propriedades. Ela e perfeitamente simetrica 
(tern uma assimetria de 0) e tern um curtose de 0. 

Distribuigao qui-quadrado: a distribuigao de 
probabilidade da soma dos quadrados de diversas 
variaveis normalmente distribuldas. Ela e geral¬ 
mente utilizada para testar hipoteses sobre dados 
categoricos. 

Editor de dados (Data editor ): a janela principal 
no SPSS na qual se entram com os dados e se exe¬ 
cutant as fungoes estatlsticas. 

Editor de sintaxe: uma janela no SPSS para es- 
crever e editar a sintaxe. 
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Efeito “alcool” (beer-goggles): fenomeno em que 
pessoas do sexo oposto (ou do mesmo, dependen- 
do da orientaqao sexual) tendem a parecer mais 
atrativas apos alguns goles de bebida alcoolica. 

Efeito de interan&o: o efeito combinado de duas 
ou mais variaveis previsoras numa variavel de 
salda. 

Efeito principal: o efeito unico de uma variavel 
previsora (ou variavel independente ) numa va- 
ridvel de salda. O termo e geralmente usado no 
contexto da ANOVA. 

Efeito supressor: quando um previsor tern um 
efeito significativo, mas somente quando outra 
variavel e mantida constante. 

Efeito tedio: refere-se a possibilidade de que o 
desempenho em tarefas possa ser influenciado (a 
hipotese e que ele seja uma influencia negativa) 
por tedio ou falta de concentragao se muitas tare¬ 
fas existirem, ou se elas durarem muito tempo. 

Efeitos praticos: relacionado a possibilidade de 
que o desempenho de um participante em uma ta- 
refa seja influenciado (positiva ou negativamente) 
se a tarefa for repetida em virtude da familiaridade 
com a situa^ao experimental e/ou com as medidas 
sendo utilizadas. 

Encolhimento: a perda do poder preditivo de um 
modelo de regressao se o modelo foi derivado de 
uma populagao da qual a amostra foi retirada em 
vez da propria amostra. 

Equamax: um metodo de rotaqdo ortogonal hfbri- 
do do quantimax e varimax. Ele pode se comportar 
erraticamente (ver Tabachnick e Fidell, 2001), 
portanto, talvez seja melhor evita-lo. 

Erro padrao das dil'erencas: se voce fosse tirar 
muitos pares de amostras de uma popula§ao e 
calcular suas medias, poderia tambem calcular a 
diferen§a entre suas medias. Se voce tra§ar essas 
diferenqas entre as medias das amostras como 
uma distribuiqdo de frequencias, tera a distri- 
buiqao amostral das diferennas. O desvio padrao 
dessa distribuinao amostral e o erro padrao das 
diferenqas. Desse modo, ele e a medida da va- 
riabilidade das diferennas entre as medias das 
amostras. 


Erro padrao: o desvio padrao da distribuiqdo 
amostral de uma estatfstica. Para uma determinada 
estatfstica (por exemplo, a media), ele informa 
quanta variabilidade existe nessa estatfstica atraves 
das amostras da mesma populaqdo. 

Erro SSCP (E): a soma dos quadrados dos erros 
e a matriz produto cruzado. Ele e a soma dos 
quadrados e matriz produto cruzado para o erro 
em um modelo linear preditivo ajustado a dados 
multivariados. Ele representa a variancia ndo- 
sistematica e e o equivalente multivariado da soma 
dos quadrados dos reslduos. 

Erro tipo I: ocorre quando acreditamos que exista 
um efeito genufno na nossa popula^ao, mas de 
fato, ele nao existe. 

Erro tipo II: ocorre quando acreditamos que nao 
exista um efeito na populagao, mas, na verdade, 
ele existe. 

Erros independentes: para quaisquer duas obser¬ 
vances em regressao, os reslduos nao devem estar 
correlacionados (devem ser independentes). 

Escore discriminante: um escore para um caso 
individual de uma CL (variate) fun§ao discrimi¬ 
nante obtido pela substituiQao do escore do caso 
na variavel medida na equanao que define a CL em 
questao. 

Escore do fator: um unico escore de uma enti- 
dade representando seu desempenho em alguma 
variavel latente. O escore pode ser grosseiramente 
conceitualizado da seguinte forma: pegue o es¬ 
core de uma entidade em cada uma das variaveis 
que compoe um fator e multiplique-o pela carga 
correspondente para a variavel e entao some esses 
valores (ou faga a media deles). 

Escore-z: o valor de uma observanao expresso 
em unidades de desvios padrao. Ele e calculado 
pegando a observagao, subtraindo dela a media de 
todas as observances e dividindo o resultado pelo 
desvio padrao de todas as observances. Conver- 
tendo a distribuinao das observanoes em escores-z, 
voce cria uma nova distribuinao que tern uma me¬ 
dia de 0 e um desvio padrao de 1. 

Esfericidade: uma fonna menos restritiva da si- 
metria composta que assume que as variancias das 
diferennas entre os dados obtidos de um mesmo 
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participante (ou qualquer outra entidade sendo 
testada) sejam iguais. Essa hipotese e mais comu- 
mente encontrada na AN OVA de medidas repetidas 
e se aplica somente quando ha mais do que dois 
pontos dos dados do mesmo participante (veja 
tambem a corregdo de Greenhouse e Geisser e a 
corregao de Huynh-Feldt). 

Estatistica de Wald: um teste estatistico com uma 
distribuigdo de probabilidade conhecida (uma 
distribuigdo qui-quadrado) usado para testar se 
o coeficiente b para um previsor num modelo de 
regressao logistica e significativamente diferente 
de zero. Ele e analogo a estatistica t num modelo 
de regressao no qual e simplesmente o coeficiente 
b dividido pelo seu erro padrao. A estatistica de 
Wald nao e precisa quando o coeficiente de re¬ 
gressao ( b ) for grande porque o erro padrao tende 
a inflacionar, assim subestimando a estatistica de 
Wald. 

Estatistica do escore eficiente de Roa: uma es¬ 
tatistica mensurando o mesmo que a estatistica de 
Wald, mas computacionalmente mais facil de ser 
calculada. 

Estatistica t: o t do estudante e um teste estatisti¬ 
co com uma distribuigdo de probabilidade (a dis- 
tribuigao t ) conhecida. No contexto de regressao, 
ele e usado para testar se um coeficiente de regres¬ 
sao b e significativamente diferente de zero: no 
contexto de um trabalho experimental, ele e usado 
para testar se as diferengas entre duas medias sao 
significativamente diferentes de zero (veja tambem 
o teste t independente e teste t dependente). 

Estatistica teste: uma estatistica para a qual sa- 
bemos quao frequentemente os valores ocorrem. 

O valor observado de tal estatistica e tipicamente 
usado para testar hipoteses. 

Estimativa de maxima verossimilhanga: uma 

maneira de estimar parametros escolhendo os pa¬ 
rametros que tornam os dados mais provaveis de 
terem acontecido. Imagine que calculamos a pro¬ 
babilidade de conseguir os dados observados para 
um conjunto de parametros: se essa probabilidade 
e alta, esses parametros geram uma boa aderencia 
dos dados; inversamente, se a probabilidade for 
baixa, esses parametros nao produzem uma boa 
aderencia para os nossos dados. A estimativa de 


maxima verossimilhanga escolhe os parametros 
que maximizam a probabilidade. 

Eta ao quadrado: uma medida do tamanho de 
efeito que e a razao entre a soma dos quadrados do 
modelo para a soma dos quadrados totais - assim, 
e o coeficiente de determinagdo com outro nome. 
Francamente, e uma perda de tempo, nao somente 
porque ele e viciado, mas ele tambem mede o 
efeito global da ANOVA e assim nao pode ser in- 
terpretado de forma significativa. 

Exp(B): um indicador de mudangas nas chances 
resultante da mudanga de uma unidade no previsor 
na regressao logistica. Se o valor e maior que 1, 
ele indica que a medida que o previsor aumenta, as 
chances do resultado ocorrer tambem aumentam. 
Contrariamente, um valor menor que 1 indica que 
a medida que o previsor aumenta, a chance do re¬ 
sultado acontecer diminui. 

Extragao: um termo utilizado no processo de 
decidir se um fator na analise defat ores e estatisti- 
camente importante para ser “extraido” dos dados 
e interpretado. A decisao e baseada na magnitude 
do autovalor associado ao fator. Veja diagrama de 
declividade, criterio de Kaiser. 

F de Brown-Forsythe: uma versao da razao F 
projetada para ser utilizada quando a hipotese da 
homogeneidade da variancia for violada. 

F de Welch: uma versao da razao F projetada para 
ser precisa quando a hipotese de homogeneidade 
das varidncias for violada. 

Fator de inflagao da variancia (FIV): uma medi¬ 
da da multicolinearidade. O FIV indica se um pre¬ 
visor tern um forte relacionamento linear com o(s) 
outro(s) previsor(es). Myers (1990) sugere que o 
valor de 10 e preocupante. Bowerman e O’Connell 
(1990) sugerem que se a media do FIV e maior do 
que 1, a multicolinearidade pode tomar o modelo 
de regressao tendencioso. 

Fator: outro nome para uma variavel independen¬ 
te ou previsor tipicamente utilizado na descrigao 
de delineamentos experimentais. No entanto, ele 
tambem e utilizado como sinonimo de variavel 
latente na analise de fatores. 

Fatoragao alfa: um metodo de analise de fatores. 
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Fi (Phi): uma medida da forga da associajao entre 
duas variaveis categoricas. O fi e usado com tabe- 
las de contingencia 2x2 (tabelas nas quais ha duas 
variaveis categoricas e cada variavel tem somente 
duas categorias). Ele e uma v ariante do teste do 
qui quadrado % 2 : (j>=\Z')Cl n , onde n e o numero 
total de observances. 

FIV: veja fatorde inflaqao da varidncia. 

Generalizacao: a habilidade de um modelo esta- 
tlstico informar algo alem do conjunto de dados 
ern que ele foi baseado. Se um modelo generaliza, 
assume-se que previsoes desse modelo podem 
ser aplicadas nao apenas a amostra na qual ele foi 
baseado, mas para a populajao de onde a amostra 
foi extralda. 

Glossario: uma colegao de definigoes imprecisas 
(escritas tarde da noite, quando voceja deveria 
estar dormindo) sobre coisas que voce pensa que 
ja entendeu ate que um editor de livros o obrigue 
a defini-las. 

Grafico de intera^ao: um grafico mostrando as 
medias de duas ou mais variaveis independentes no 
qual as medias de uma variavel sao mostradas em 
diferentes nlveis da outra variavel. Excepcional- 
mente, as medias estao conectadas por linhas ou es¬ 
tao expostas como barras. Esses graficos sao usados 
para ajudar a entender os efeitos de interaqao. 

Graus de liberdade (Degrees of freedom): algo 
imposslvel de explicar em algumas paginas que 
dira em poucas linhas. Essencialmente, e o numero 
de “entidades” que estao livres para variar quando 
se estima algum tipo de parametro estatlstico. 

Ele e usado em varios testes de significance para 
niuitas das estatlsticas mais utilizadas como o 
teste F, o teste t e o teste qui-quadrado, e serve 
para determinar a distribuiqao de probabilidade da 
estatlstica teste utilizada. A explicanao envolvendo 
jogadores de rubgi, no Capltulo 8, e mais interes- 
sante... 

HE 1 : uma matriz funcionalmente equivalente a 
hipotese SSCP dividida pelo erro SSCP na MA- 
NOVA. Conceitualmente, ela representa a razao da 
varidncia sistematica para a nao-sistemdtica, e e a 
analoga multivariada da razao F. 

Heterocedasticidade: o contrario de homocedas- 
ticidade. Isso ocorre quando os reslduos em cada 


nlvel da(s) variavel(s) previsora(s) tern variancias 
diferentes. Colocando de outra maneira, em cada 
ponto ao longo de qualquer variavel previsora, a 
distribuinao dos reslduos e diferente. 

Hipotese experimental: a previsao de que a ma- 
nipulagao experimental tera algum efeito ou que 
certas variaveis se relacionarao entre si. 

Hipotese nula: reverso da hipotese experimental 
de que sua previsao esta errada e que o efeito pre- 
visto nao existe. 

Hipotese SSCP (PT): a hipotese soma dos quadra- 
dos e matriz do produto cruzado. Essa e a matriz 
da soma dos quadrados e do produto cruzado para 
o modelo linear preditivo ajustado aos dados mul- 
tivariados. Ela representa a varidncia sistematica 
e a equivalente multivariada ao da soma dos qua¬ 
drados do modelo. 

Hipotese: uma previsao sobre o estado do mundo 
(veja hipotese experimental e hipotese nula). 

Histograma: veja distribuiqao de frequencia. 

Homocedasticidade: uma hipotese da analise de 
regressao em que os reslduos em cada nlvel da(s) 
variavel(s) previsora(s) tem variancias similares. 
Ou seja, em cada ponto ao longo de qualquer va¬ 
riavel previsora, a distribuigao dos reslduos deve 
ser constante. 

Homogeneidade da variancia: uma hipotese de 
que a variancia de uma variavel e estavel (isto e, 
relativamente similar) em todos os nlveis de outra 
variavel. 

Homogeneidade das inchnacoes da regressao: 

uma hipotese da analise da covaridncia. Essa e 
uma hipotese em que o relacionamento entre a 
covaridncia e a variavel da saida e constante ao 
longo dos diferentes nlveis de tratamento. Assim, 
para tres condigoes de tratamento, se existe um 
relacionamento positivo entre a covariavel e a 
saida em um grupo, presumimos que exista um 
relacionamento positivo de tamanho semelhante 
entre a covariavel e a saida nos outros dois grupos 
tambem. 

Homogeneidade das matrizes de covariancias: 

uma hipotese de alguns testes multivariados como 
a MANOVA. E uma extensao da hipotese da 
homogeneidade da variancias na analise univa- 
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riada. Entretanto, assim como se assume que as 
varidncias sao as mesmas ao longo dos grupos, ela 
tambem assume que os relacionamentos (covarian- 
cias) entre essas variaveis dependentes sao apro- 
ximadamente iguais. Ela e testada comparando as 
matrizes de variancias-covariancias dos diferentes 
grupos na analise. 

Independencia: a hipotese de que um ponto de 
dados nao influencia outro. Quando os dados sao 
provenientes de pessoas, isso basicamente signi- 
fica que o comportamento de um participante nao 
influencia o comportamento de outro. 

Influencia (Leverage): estatislicas de influen- 
cias (ou valores chapeu) calculam a influencia 
do valor observado da safda da variavel sobre os 
valores previstos. O valor medio da influencia e 
(k + 1)//!, no qual Leo numero de previsores no 
modelo ene o numero de participantes. Os valo¬ 
res da influencia podem estar entre 0 (o caso nao 
tern influencia alguma) e 1 (o caso tern completa 
influencia sobre a previsao). Se nenhum dos ca- 
sos exerce desmedida influencia sobre o modelo, 
devemos esperar que todos os valores da estatis¬ 
tica influencia estejam proximos ao valor medio. 
Hoaglin e Welsch (1978) recomendam investigar 
casos com valores maiores do que duas vezes a 
media (2 (k + 1 )/n) e Stevens (1992) recomenda 
usar tres vezes a media (3 (k + 1 )ln) como um 
ponto de corte para identificar casos com influen¬ 
cia desmedida. 

Intervalo de confianga: para uma dada estatistica 
obtida de uma amostra (por exemplo, a media), o 
intervalo de confianga e um conjunto de valores 
em tomo da estatistica que se acredita que con- 
tenha, com uma determinada probabilidade (por 
exemplo, 95%), o verdadeiro valor da estatistica 
(isto e, o valor populacional). 

Intervalo interquartflico: os limites que content 
50% de um conjunto de observagoes. 

Lambda (L) de Goodmann and Kruskal: mede 
a redugao proporcional no erro obtida quando 
um membro de uma categoria de uma variavel e 
utilizado para prever a inclusao em uma categoria 
de outra variavel. Um valor de 1 significa que uma 
variavel preve perfeitamente a outra enquanto um 
valor de 0 indica que uma variavel nao preve a ou¬ 
tra de forma alguma. 


Lambda de Wilks (A): um teste estatistico na 
MAN OVA. Ele e o produto da variancia nao expli- 
cada em cada uma das combinagoes lineares da 
fungao discriminante, assim, ele representa a razao 
entre a variancia do erro e a variancia total (SS R / 
SS T ) para cada combinagao linear. 

Leptocurtica: veja curtose. 

Limite inferior: o nome dado para o valor mais 
baixo possivel para a estimativa de esfericidade de 
Greenhouse e Geisser. Seu valor e l/k—l, onde k e 
o numero das condigoes de tratamento. 

Maior raiz de Roy: um teste estatistico na MA- 
NOVA. Ele e o autovalor para a primeira com- 
binagdo linear da fungao discriminante de um 
conjunto de observagoes. Assim, ela e o mesmo 
que o trago de Hotelling-Lawley, mas apenas para 
a primeira variavel. Ele representa a proporgao 
da variancia explicada em relagao a variancia 
nao-explicada (SS M /SS R ) para a primeira fungao 
discriminante. 

MANOVA: acronimo para analise de variancia 
multivariada (multivariate analysis of variance). 

Matriz componente: termo generico para uma 
matriz estrutura na analise de componentes prin- 
cipais no SPSS. 

Matriz de fatores: um termo generico para a es¬ 
trutura matricial na analise de fatores do SPSS. 

Matriz de transformagao dos fatores, A: uma 

matriz utilizada na analise de fatores. Ela pode ser 
pensada como contendo os angulos pelos quais os 
fatores sao girados na rotagdo de fatores. 

Matriz de variancias-covariancias: uma ma¬ 
triz quadrada (isto e, mesmo numero de linhas e 
colunas) representando as variaveis mensuradas. 
As diagonals representam as variancias dentro 
de cada variavel enquanto os elementos fora da 
diagonal representam as covariancias entre pares 
de variaveis. 

Matriz estrutural: uma matriz na analise dos fa¬ 
tores contendo os coeficientes de correlagao para 
cada variavel em cada fator dos dados. Quando 
a rotagdo ortogonal e usada, ela e a mesma que 
a matriz padrdo, mas quando a rotagao obKqua e 
usada, essas matrizes sao diferentes. 
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Matriz identidade: uma matriz quadrada (isto e, 
com o mesmo numero de linhas e colunas) em que 
os elementos da diagonal sao iguais ale todos os 
demais sao iguais a zero. As seguintes sao exern- 
plos desse tipo de matriz: 



'1 0 0 0 ' 
0 10 0 
0 0 10 
.0 0 0 1 , 


Matriz padrao: uma matriz na analise defatores 
contendo os coeficientes de regressao para cada 
variavel em cada fcitor dos dados (veja tambem 
matriz estrutural). 


Matriz quadrada: uma matriz que tern um nume¬ 
ro igual de colunas e linhas. 

Matriz SSCP total (T): a soma total dos quadra- 
dos e matriz do produto cruzado. Ela e a soma dos 
quadrados e matriz dos produtos cruzados para 
um conjunto complete de observances. Ela e a 
versao multivariada equivalente a soma total dos 
quadrados. 

Matriz: uma colegao de numeros organizados 
em linhas e colunas. Os valores dentro da matriz 
sao tipicamente referidos como componentes ou 
elementos. 


Mediana: o escore do meio de um conjunto orde- 
nado de observances. Quando existe um numero 
par de observanoes a mediana e a media dos dois 
escores que estao nos lados do valor que suposta- 
mente estaria no meio. 

Medida da adequanao da amostra de Kaiser- 
Meyer-Olkin (KMO): pode ser calculada para 
variaveis individuals ou multiplas e representa a 
razao das correlanoes ao quadrado entre variaveis 
para a correlaqao parcial ao quadrado entre as va¬ 
riaveis. Ela varia entre 0 e 1: um valor de 0 indica 
que a soma das correlanoes parciais e grande em 
relanao a soma das correlanoes, indicando difusao 
no padrao das correlanoes (entretanto, a analise 
dosfatores e provavelmente inapropriada); um va¬ 
lor proximo a 1 indica que padroes de correlanoes 
sao relativamente compactos, assim, a analise dos 
fatores deve produzir fatores distintos e conhaveis. 
Valores entre 0,5 e 0,7 sao medlocres, valores en¬ 
tre 0,7 e 0,8 sao bons, valores entre 0,8 e 0,9 sao 
muito bons e valores acima de 0,9 sao soberbos 
(veja Hutcheson e Sofroniou, 1999). 

Metodo de Anderson-Rubin: uma forma de cal- 
cular escores defatores que produz escores que 
sao nao-correlacionados e padronizados com me¬ 
dia 0 e desvio padrao 1. 


Media: um modelo estatistico simples do centra 
da distribuinao dos escores. Uma estimativa hipo- 
tetica do escore “tipico”. 

Media Ajustada: no contexto da analise de cova- 
ridncia, esse e o valor da media do grapo ajustada 
para o efeito da covariavel. 

Media dos Quadrados: uma medida de variabi- 
lidade media. Para cada soma dos quadrados (que 
mensuram a variabilidade total), e posslvel criar 
a media dos quadrados dividindo pelo numero de 
coisas usadas para calcular a soma dos quadrados 
(ou alguma funnao dela). 

Media geral: a media de conjunto complete de 
observanoes. 

Media Harmonica: e o inverso da media aritmeti- 
ca dos inversos. 


Metodo Monte Carlo: um termo aplicado ao pro- 
cesso de usar simulanoes de dados para resolver 
problemas estatfsticos. 

Moda: o escore mais frequente num conjunto de 
dados. 

Modelo de regressao: veja regressao simples e 
regressao multipla. 

Modelo linear: um modelo baseado numa linha 
reta. 

Modelo saturado: um modelo que se ajusta per- 
feitamente aos dados e, portanto, nao tern erro. Ele 
content todos os efeitos principals e interagdes 
posslveis entre as variaveis. 

Multicolinearidade: uma situanao em que duas 
ou mais variaveis apresentam um relacionamento 
linear proximo. 

Multimodal: uma distribuinao de dados que apre- 
senta mais do que duas modas. 
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Multivariada: significa “muitas variaveis” e e 
geralmente usada quando se refere a analises nas 
quais existe mais do que uma varidvel de salda 
(por exemplo, MANOVA, analise de componentes 
principals, etc.). 

Nivel a: a probabilidade de cometer erro do tipo I 
(nomialmente esse valor e 5%). 

Nivel /3: A probabilidade de cometer erro do Tipo 
II (Cohen, 1992, sugere um valor maximo de 
0 , 20 ). 

Normalidade multivariada: uma extensao de 
uma distribuigao normal a multiplas variaveis. Ela 
e uma distribuigao de probabilidade de um con- 
junto de variaveis v’ = [v l5 v 2 vj dado por: 

Kv V v 2 , ...,v n ) = 

2?r 2 |X1| 2 expj^-^-(tt-/ry^ (V~fi) j 

onde qual peo vetor das medias das variaveis e X 
e a matriz variancias-covariancias. Se isso fizer 
sentido para voce, entao voce e mais inteligente do 
que eu. 

O Trago (T 2 ) de Hotelling-Lawley: um teste es- 
tatlstico na MANOVA. E a soma dos autovalores 
para cada CL ( variate ) da fungao discriminante 
dos dados, assim, conceitualmente e o mesmo que 
a razao F na ANOVA: ele e a soma da razao da 
varidncia sistematica pela nao-sistemdtica (SS M / 
SS R ) para cada uma das variaveis. 

Oblimin Direto: um metodo de rotagao obliqua. 

Omega ao quadrado: uma medida do tamanho de 
efeito associado a ANOVA menos tendenciosa do 
que o eta ao quadrado. Ela e uma fungao (as vezes 
horrenda) da soma dos quadrados do modelo e da 
soma dos quadrados dos reslduos e nao e muito 
util, pois mede o efeito geral da ANOVA e, assim, 
nao pode ser interpretada de uma maneira signifi- 
cativa. Em todos os outros sentidos ela e otima. 

Ortogonal: isso significa perpendicular (angulo 
reto) a algo. Ele tende a ser equiparado com inde¬ 
pendence em estatistica por causa da conotagao 
de que os modelos lineares perpendiculares no 
espago geometrico sao completamente indepen- 
dentes (um nao e influenciado pelo outro). 


Padroniza^ao: o processo de converter uma varia- 
vel em uma unidade padrao de medida. A unidade 
de medida tipicamente usada e o desvio padrao 
(veja tambem escores-z). A padronizagao nos per- 
mite comparer dados quando diferentes unidades 
de medidas foram usadas (podemos comparer me- 
didas de peso em quilogramas com altura medida 
em polegadas). 

Padronizado: veja padronizagao. 

Parcializar: para parcializar o efeito de uma va- 
riavel, devemos controlar o efeito que a variavel 
tern no relacionamento entre duas outras variaveis 
(veja correlagcio parcial). 

Pesos: um numero pelo qual algo (geralmente uma 
variavel em estatistica) e multiplicado. O peso atri- 
buldo a uma variavel determina a influencia que 
aquela variavel tern dentro de uma equagao mate- 
matica: muito peso da a variavel muita influencia. 

Platicurtica: veja curtose. 

Poder: a habilidade de um teste detectar um efeito 
de um tamanho especlfico (um valor de 0,8 e um 
bom nlvel para se atingir). 

Populagao: em termos estatlsticos, isso geralmen¬ 
te se refere a coleta de unidades (sejam pessoas, 
plancton, plantas, cidades, autores suicidas, etc.) 
para a qual queremos generalizar o conjunto de 
constatagoes ou o modelo estatlstico. 

Produto-cruzado dos desvios: uma medida do 
relacionamento total entre duas variaveis. Ele e o 
produto dos desvios de uma variavel em relagao 
a sua media multiplicada pelos desvios da outre 
variavel em relagao a media. 

Promax: um metodo de rotagao obliqua computa- 
cionalmente mais rapido do que oblimin e util para 
grandes conjuntos de dados. 

Q de Cochran: esse teste e uma extensao do teste 
de McNemar e ele e basicamente uma ANOVA de 
Friedman para dados dicotomicos. Por exemplo, 
se perguntassemos a 10 pessoas se elas gostariam 
de atirar em Justin Timberlake, David Beckham 
e Tony Blair e elas so pudessem responder sim 
ou nao, e as respostas fossem codificados como 0 
(nao) e 1 (sim). poderfamos utilizar o teste de Co¬ 
chran nesses dados. 
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Quartimax: um metodo de rotagao ortogonal. Ele 
tenta maximizar a dispersao das cargas de um fator 
para uma variavel ao longo de todos os fatores. 
Geralmente, isso resulta em diversas variaveis com 
altas cargas em um unico fator. 

R multiplo: o coeficiente de ccrrelagac multipla. 
Ele e a correlagao entre os valores observados de 
uma safda e os valores de uma safda prevista por 
um modelo de regressao multipla. 

R 2 ajustado: uma medida da perda do poder pre- 
ditivo ou encolhimento na regressao. O R 2 ajustado 
nos informa quanta variancia na safda sera de res- 
ponsabilidade do modelo derivado da populaqao 
de onde a amostra foi retirada. 

R 2 cs de Cox e Snell: uma versao do coeficiente 
de determinagao para a regressao logfstica. Ele 
e baseado na verossimilhanga log de um modelo 
(LL(Novo)) e a verossimilhanga log do modelo 
original (LL(base)), e o tamanho da amostra, n. 
Entretanto, ele se destaca por nao alcangar seu va¬ 
lor maximo de 1 Iyer R 2 N de Nagelkerke). 

R 2 l de Hosmer e Lemeshow: Uma versao do 
coeficiente de determinagao para a regressao lo¬ 
gfstica. E uma tradugao bent literal no sentido de 
que ele e o —2LL do modelo dividido pelo —2LL 
original; em outras palavras, ele e a razao do que 
o modelo pode explicar comparado ao que havia 
para ser explicado em primeiro lugar! 

R 2 n de Nagelkerke: Uma versao do coeficiente 
de determinagao para a regressao logfstica. Ele e 
uma variagao do R 2 CS de Cox e Snell que supera o 
problema que essa estatfstica tern de nao ser capaz 
de alcangar seu valor maximo. 

Razao de Chances: a razao entre a probabilidade 
de um evento ocorrer em um grupo comparado 
com outro. Assim, por exemplo, se a chance de 
morrer apos escrever o glossario e 4 e a chance de 
morrer se nao escrever o glossario e de 0,25, a ra¬ 
zao de chances e de 4/0,25 = 16. Isto significa que 
se voce escrever um glossario, tern 16 vezes mais 
chances de morrer do que se nao escreve-lo. Uma 
razao de chances de 1 indicaria que a chance de 
uma safda particular e igual em ambos os grupos. 

Razao de covariancia (RCV): uma medida do 
quanto um caso (valor individual) influencia a 
variancia das estimativas dos parametros em um 


modelo de regressao. Quando essa razao estiver 
proxima de 1, o caso tern pouca influencia sobre 
as variancias das estimativas do modelo. Balsey e 
colaboradores. (1980) recomendam o seguinte: se 
o RCV de um caso for maior que 1 + [3(k + l)/n], 
eliminar esse caso afetara a precisao da estimativas 
de alguns dos parametros dos modelos, mas se ele 
for menor do que 1 - [3(k + l)/n], retirar o caso da 
analise melhorara a precisao das estimativas (k e o 
numero de previsores e n e o tamanho da amostra). 

Razao de variancias: a variancia do grupo com 
a maior variagao dividida pela variancia do grupo 
com a menor variagao. Se essa razao for menor 
do que 2, e seguro supor a homogeneidade das 
variancias. 

Razao F: uma estatfstica teste com uma distribui- 
gdo de probabilidade conhecida (a distribuigao F). 
E a razao entre variabilidade media nos dados que 
um dado modelo pode explicar para a variabilida¬ 
de media que nao pode ser explicada pelo mesmo 
modelo. Ela e utilizada para testar o ajuste global 
dos modelos de regressao simples e multipla e 
para testar a diferenga global entre grupos de me- 
dias em experimentos. 

Reagoes extremas de Moses: um teste 
nao-parametrico que compara a variabilidade dos 
escores em dois grupos, assim, e parecido com o 
teste nao-parametrico de Levene. 

Regra da soma das variancias: isso afirma que 
a variancia da diferenga entre duas variaveis inde- 
pendentes e igual a soma das suas variancias. 

Regressao Hierarquica: um metodo de regressao 
multipla no qual a ordem em que os previsores 
entram no modelo de regressao e determinada 
pelo pesquisador baseado em pesquisas previas: 
variaveis que ja sabemos serem previsoras entram 
primeiro, novas variaveis entram depois. 

Regressao logistica: uma versao da regressao 
multipla em que a safda e dicotdmica. 

Regressao multipla: uma extensao da regressao 
simples na qual uma safda e prevista por uma com- 
binagao linear de duas ou mais variaveis previso¬ 
ras. A forma do modelo e Y t = {b Q + b 1 X 1 + b 2 X 2 
+ ... + bfiifi + A, no qual a safda e representada 
por Y e cada previsor e representado por X. Cada 
previsor tern um coeficiente de regressao b t asso- 
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ciado a ele e b 0 e o valor da safda quando todos os 
previsores sao zero. 

Regressao passo a passo: um metodo de regres¬ 
sao multipla no qual as variaveis entram no mode- 
lo baseadas num criterio estatfstico (a correlagao 
semi-parcial com a variavel de safda). Uma vez 
que uma nova variavel e colocada no modelo, to- 
das as variaveis do modelo sao avaliadas para ver 
se elas devem ser removidas. 

Regressao por bloeos: outro nome para a regres¬ 
sao hierdrquica. 

Regressao simples: um modelo linear no qual 
uma variavel ou safda e prevista a partir de uma 
unica variavel previsora. O modelo toma a forma 
Yj = (ft 0 + bjXj) + A na qual Ye a variavel de 
safda, Xea previsora, ft, e o coeficiente de regres¬ 
sao associado com a previsora, eb 0 e o valor da 
safda quando o previsor e zero. 

Resfduo eliminado: uma medida da influencia de 
um caso (observagao) especffico dos dados. Ele e 
a diferenga entre o valor previsto ajustado para o 
caso e o valor original observado para esse mesmo 
caso. 

Resfduo estudentizado eliminado: uma medida 
da influencia de um caso especffico dos dados. Ele 
e a versao padronizada do residuo eliminado. 

Resfduo: a diferenga entre o valor que um modelo 
preve e o valor observado nos dados em que o mo¬ 
delo e baseado. Quando o resfduo e calculado para 
cada observagao no conjunto de dados, a colegao 
resultante e referida como residuos. 

Resfduos estudentizados: uma variagao dos resf¬ 
duos padronizados. Resfduos estudentizados sao 
os residuos nao-padronizados divididos por uma 
estimativa de seu desvio padrao que varia de ponto 
a ponto. Esses resfduos tern as mesmas proprieda- 
des que os resfduos padronizados, mas geralmente 
fornecem estimativas mais precisas da variancia 
do erro de um caso especffico. 

Resfduos nao-padronizados: os residuos de um 
modelo expressos nas unidades em que a variavel 
de safda original foi mensurada. 

Resfduos ou Desvios: a diferenga entre valores 
observados de uma variavel e os valores dessa 
mesrna variavel previstos pelo modelo estatfstico. 


Resfduos padronizados: os residuos de um mo¬ 
delo expresso em unidades de desvios padrao. 
Resfduos padronizados com valor absoluto maior 
do que 3,29 (na verdade, geralmente usamos 3) 
sao causa de preocupagao porque numa amostra 
padrao um valor tao alto e improvavel de acontecer 
por acaso; se mais de 1% de suas observagoes tern 
resfduos padronizados com valor absoluto maior do 
que 2,58 (geralmente dizemos 2,5), ha evidencias 
de que o nfvel de erro dentro do nosso modelo nao 
e aceitavel (o modelo e um ajuste muito pobre dos 
dados da amostra); se mais do que 5% das observa¬ 
nces tern resfduos padronizados em valores absolu- 
tos maiores do que 1,96 (ou 2, por conveniencia), 
ha tambem evidencias de que o modelo e uma 
representagao pobre dos dados reais. 

Resfduos: veja residuo. 

Rotagao obifqua: um metodo de rotagao na ana- 
lise defatores que permite que os fatores subja- 
centes sejam correlacionados. 

Rotagao ortogonal: um metodo de rotagao na 
analise defatores que mantem os fatores subja- 
centes independentes (isto e, nao-correlacionados). 

Rotagao: um processo na analise defatores para 
melhorar a interpretagao dos fatores. Em essen- 
cia, e uma tentativa de transformar os fatores que 
emergent da analise de modo a maximizar as 
maiores cargos e minimizar as menores. Existem 
duas abordagens gerais: rotagao ortogonal e rota¬ 
gao obliqua. 

Separagao completa: uma situagao na regressao 
logistica quando uma variavel de safda pode ser 
perfeitamente prevista por um previsor ou uma 
combinagao de previsores! Essa situagao faz o seu 
computador ter o equivalente a um ataque de ner- 
vos: ele comegara a gaguejar, chorar e dizer que 
ele nao sabe o que fazer. 

Simetria composta: uma condigao que se toma 
verdadeira quando ambas as variancias das con- 
digoes sao iguais (e o mesmo que a hipotese da 
homogeneidade da variancia) e as covariancias 
entre pares de condigoes sao, tambem. iguais. 

Sintaxe: comandos escritos predefinidos que 
instruem o SPSS a fazer o que voce gostaria que 
ele fizesse (escrever “Me deixa em paz!” nao fun- 
ciona). 
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Soma dos erros ao quadrado: outro nome para a 
soma dos quadrados. 

Soma dos quadrados (SS): uma estimativa do 
total da variabilidade (espalhamento) de um con- 
junto de dados. Em primeiro lugar, um desvio para 
cada escore e calculado e, depois, esse valor e ele- 
vado ao quadrado. A SS e a soma desses desvios 
elevados ao quadrado. 

Soma dos quadrados do modelo: uma medida da 
variabilidade total que um modelo pode explicar. 

E a diferenqa entre a soma dos quadrados total e a 
soma dos quadrados dos residuos. 

Soma dos quadrados dos residuos: uma medida 
da variabilidade que nao pode ser explicada pelo 
modelo ajustado aos dados. Ela e o total dos des¬ 
vios ao quadrado entre as observances e o valor 
dessas observances previsto por qualquer modelo 
que foi ajustado aos dados. 

Soma dos quadrados e matriz dos produtos cru¬ 
zados (SQPC): uma matriz quadrada em que os 
elementos diagonals representam a soma dos qua¬ 
drados para uma variavel especffica e os elementos 
fora da diagonal representam os produtos cruzados 
entre os pares de variaveis. A matriz SQPC e ba- 
sicamente a mesma que a matriz das variancias- 
covaridncias exceto que ela expressa variabilidade 
e relacionamentos entre variaveis corno valores 
totais enquanto a matriz de variancias-covariancias 
os expressa como valores medios. 

Soma total dos quadrados: uma medida da va¬ 
riabilidade dentro de um conjunto de observances. 
Ela e soma total dos quadrados dos desvios entre 
cada observaqao e a media geral das observances. 

Tabela de contingencia: uma tabela represen- 
tando uma classificanao cruzada de duas ou mais 
variaveis categoricas. Os niveis de cada variavel 
sao alocados em uma grade e o numero de ob¬ 
servances em cada categoria e apresentado nas 


celulas da tabela. Por exemplo, se tomarmos a 
variavel categorica glossario (com duas catego- 
rias: se um autor escreveu um glossario ou nao) e 
estado mental (com tres categoriais: normal, solu- 
qando incontrolavelmente e totalmente psicotico), 
podemos construir uma tabela como a mostrada 
a seguir. Isso nos informa que 127 autores que 
escreveram um glossario acabaram totalmente 
psicoticos, comparados com somente 2 que nao 
escreveram um glossario. 

Tamanho de efeito: uma medida objetiva e pa- 
dronizada da magnitude de um efeito observado. 
As medidas incluem o d de Cohen, g de Glass e o 
coeficiente de correlanao r de Pearson. 

Tau de Kendall: um coeficiente de correlanao 
nao-parametrico similar ao coeficiente de correla- 
gdo de Spearman, mas deve ser preferido quando 
voce tern um conjunto pequeno de dados com um 
numero grande de postos empatados. 

Taxa de erro com experimentos passo a passo: a 

probabilidade de cometer erro do tipo I em um ex- 
perimento envolvendo uma ou mais comparanoes 
estatlsticas quando a hipotese nula e verdadeira em 
cada caso. 

Taxa de erro de conjunto: A probabilidade de co¬ 
meter um Erro do Tipo I em uma famflia ou con¬ 
junto de testes quando a hipotese nula e verdadeira 
em cada caso. Uma “famflia de testes” pode ser 
definida como um conjunto de testes conduzidos 
sobre o niesmo conjunto de dados e tratando da 
mesma questao emplrica. 

Tendencia cubica: se for conectado as medias 
de condinoes ordenadas com uma linha, uma ten¬ 
dencia cubica e mostrada por duas mudannas na 
direnao dessa linha. Deve-se ter pelo menos quatro 
condinoes ordenadas. 

Tendencia quadratica: se voce conectar as me¬ 
dias em condinoes ordenadas com uma linha, a 




Glossario 

Escreveu um 
glossario 

Nao escreveu 
um glossario 

Total 

Estado mental 

Normal 

5 

423 

428 


Solugando incontrolavelmente 

23 

46 

69 


Totalmente psicotico 

127 

2 

129 


Total 

155 

471 

626 
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tendencia quadratica e caracterizada por uma mu- 
danga na diregao dessa linha (por exemplo, a linha 
e curva em um lugar): a linha apresenta uma forma 
de U. Para que isso acontega, e necessario, pelo 
menos, tres condigoes ordenadas. 

Tendencia quartica: se voce conectar as medias 
ordenadas com uma linha, uma tendencia quartica 
e caracterizada por tres mudangas na diregao dessa 
linha. Voce deve ter, pelo menos, cinco condigoes 
ordenadas. 

Teste bilateral: um teste de uma hipotese nao- 
direcional. Por exemplo, a hipotese “Escrever esse 
glossario tern algum efeito no que eu quero fazer 
com as genitais do meu editor” requer um teste 
bilateral porque ele nao sugere a diregao do rela- 
cionamento (veja tambem o teste unilateral). 

Teste da mediana: um teste nao-parametrico para 
verificar se as amostras foram retiradas de uma 
populagao com a mesma mediana. Assim, ele faz o 
mesrno que o teste de Kruskal-Wallis. Ele produz 
uma tabela de contingencia dividida em dois gru- 
pos de valores que estao acima ou abaixo da me¬ 
diana. Se os grupos sao da mesma populagao voce 
espera que essas frequences sejam as mesmas em 
todas as condigoes (em torno de 50% acima e 50% 
abaixo). 

Teste da soma dos postos de Wilcoxon: um teste 
ndo-parametrico que procura por diferengas entre 
duas amostras independentes. Isto e, ele testa se as 
populagoes das quais duas amostras foram retira¬ 
das tern a mesma localizagao. Ele e funcionalmen- 
te o mesmo que o teste de Mann-Whitney e ambos 
os testes sao os equivalentes nao-parametricos do 
teste t independente. 

Teste de Box: um teste sobre a hipotese da ho- 
mogeneidade das matrizes de covariancias. Ele 
nao deve ser significativo se as matrizes forem as 
mesmas. O teste de Box e bastante suscetivel a 
desvios da normalidade multivariada e pode, en- 
tao, ser nao-significativo nao porque as matrizes 
de variancias-covariancias sejam parecidas entre 
os grupos, mas porque a hipotese de normalidade 
multivariada nao e satisfeita. Assim, e vital ter 
alguma ideia de se os dados satisfazem a hipote¬ 
se de normalidade multivariada (que e bastante 
dificil) antes de interpretar os resultados do teste 
de Box. 


Teste de Durbin-Watson: testa a correlagao serial 
entre erros nos modelos de regressao. Especifica- 
mente, ele testa se resfduos adjacentes sao corre- 
lacionados, o que e util para testar a hipotese de 
independencia dos erros. A estatistica teste pode 
variar entre 0 e 4 com um valor de 2 indicando 
que os residuos nao sao correlacionados. Um valor 
maior do que 2 indica uma correlagao negativa e 
um valor abaixo de 2 indica uma correlagao posi- 
tiva. O tamanho da estatistica de Durbin-Watson 
depende do numero de previsores no modelo e 
do numero de observagoes. Para ser preciso, voce 
deve verificar os valores de aceitagao no artigo 
original de Durbin e Watson de 1951. Como uma 
regra pratica, bastante conservadora, valores me- 
nores do que 1 e maiores do que 3 sao definitiva- 
mente motivo de atengao, no entanto, valores pro- 
ximos de 2 podem ser problematicos dependendo 
da amostra e do modelo. 

Teste de esfericidade de Bartlett: um teste sobre 
a suposigao de esfericidade. Ele examina se a 
matriz de variancias-covariancias e proporcional 
a uma matriz identidade. Dessa forma, ele testa se 
os elementos da diagonal da matriz de variancias- 
covariancias sao iguais (isto e, se as variancias 
dos grupos sao iguais) e se os elementos fora da 
diagonal sao aproximadamente zero (isto e, as va- 
ridveis dependentes nao sao correlacionados). Je¬ 
remy Miles, que faz muitas analises multivariadas, 
declara que nunca viu uma matriz que nao tenha 
tido significancia quando submetida a esse teste, 
assim, questiona a sua utilidade pratica. 

Teste de Jonckheere-Terpstra: essa estatistica 
testa um padrao ordenado de medianas entre 
grupos independentes. Essencialmente, ele faz o 
mesmo que o teste de Kruskal-Wallis (isto e, testa 
a diferenga entre as medianas dos grupos), mas 
incorpora informagao se a ordem do grupo e signi- 
ficativa. Assim, voce deve usar esse teste quando 
espera que os grupos que esta comparando produ- 
zam uma ordenagao significativa das medianas. 

Teste de Kolmogorov-Smirnov: um teste para ver 
se a distribuigao dos escores e significativamente 
diferente de uma distribuigao normal. Um valor 
significativo indica um desvio da normalidade, 
mas esse teste e notoriamente afetado por grandes 
amostras nas quais pequenos desvios da normali- 
dade geram resultados significativos. 
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Teste de Kruskal-Wallis: um teste nao-parametri- 
co para verificar se mais do que dois grupos inde- 
pendentes diferem. E a versao nao-parametrica da 
ANOVA independente de um fator. 

Teste de Levene: testa a hipotese de que as vari¬ 
ancias em diferentes grupos sao iguais (isto e, a 
diferenga entre as variancias e zero). Um resultado 
significativo indica que as variancias sao significa- 
tivamente diferentes - portanto, a hipotese de ho- 
mogeneidade das variancias foi violada. Quando 
os tamanhos das amostras sao grandes, pequenas 
diferengas em variancias de grupo podem produzir 
um teste de Levene significativo, assim, a razao 
das variancias e uma checagem dupla util. 

Teste de Mann-Whitney: um teste 
nao-parametrico que procura por diferengas en¬ 
tre duas amostras independentes. Isto e, ele testa 
se a populagao de onde as duas amostras foram 
retiradas tern a mesma localizagao. Ele e funcio- 
nalmente o mesmo que o teste da soma dos postos 
de Wilcoxon e ambos os testes sao equivalentes 
nao-parametricos do teste t independente. 

Teste de Mauchly: um teste da hipotese da esfe- 
ricidade. Se esse teste for significativo, a hipotese 
da esfericidade nao foi satisfeita e uma corregao 
apropriada deve ser aplicada aos graus de liberda- 
de da razao F na ANOVA de medidas repetidas. O 
teste compara a matriz de variant'ias-covariancias 
dos dados com uma matriz de identidade, se a 
matriz de variancias-covariancias e um multiplo 
escalar de uma matriz de identidade, a esfericida¬ 
de foi satisfeita. 

Teste de McNemar: testa as diferengas entre dois 
grupos relacionados (veja o teste de postos com 
sinais de Wilcoxon e teste dos sinais), quando 
voce tern dados nominais. Ele e tipicamente usado 
quando voce esta procurando por mudangas nos 
escores das pessoas e ele compara a proporgao 
das pessoas que mudaram sua resposta em uma 
diregao (isto e, aumento dos escores) aquelas que 
mudaram na diregao oposta (diminuigao dos esco¬ 
res). Assim, esse teste deve ser utilizado quando 
existem duas variaveis dicotomicas relacionadas. 

Teste de Shapiro-Wilk: um teste para ver se a 
distribuigao dos escores e significativamente dife- 
rente de uma distribuigao normal. Um valor sig¬ 
nificativo indica um desvio da normalidade, mas 
esse teste e afetado por amostras grandes nas quais 


pequenos desvios da normalidade geram resulta- 
dos significativos. 

Teste dos postos com sinais de Wilcoxon: um 

teste nao-parametrico que procura por diferengas 
entre duas amostras relacionadas. Ele e o nao- 
parametrico equivalente ao teste t relacionado. 

Teste dos sinais: testa se duas populates sao 
diferentes utilizando amostras relacionadas. Ele 
faz o mesmo que o teste dos postos com sinais de 
Wilcoxon. Diferengas entre as condigoes sao calcu- 
ladas e o sinal da diferenga (positivo ou negativo) 
e analisado como indicador da diregao das dife- 
rengas. A magnitude da mudanga e completamente 
ignorada (diferente do teste de Wilcoxon, onde o 
posto revela algo sobre a relativa magnitude da 
mudanga) e, por essa razao, ele apresenta perda de 
poder. Entretanto, sua simplicidade computacio- 
nal faz dele um truque simples para ser usado em 
festas na eventualidade de algum bebado abordar 
voce querendo uma analise rapida de alguns dados 
sem a ajuda de um computador - realizar o teste 
dos sinais, de cabega, realmente impressiona as 
pessoas. Na verdade, ele nao impressiona, as pes¬ 
soas irao acha-lo um bobo triste. 

Teste parametrico: um teste que requer dados de 
um grande catalogo de distribuigoes que os esta- 
tfsticos descreveram. Normalmente, esse termo e 
usado para testes parametricos baseados na distri- 
buigdo normal que requer quatro hipoteses basicas 
que precisam ser encontradas para o teste ser 
preciso: dados normalmente distribuidos (veja dis- 
tribuigao normal), homogeneidade da variancia, 
dados por inten’alo ou de razao e independencia. 

Teste qui-quadrado: embora esse termo possa 
ser aplicado a qualquer estatistica teste tendo 
uma distribuigao qui-quadrado, ele geralmente se 
refere ao teste qui-quadrado de independencia de 
Pearson entre duas variaveis categoricas. Essen- 
cialmente, ele testa se duas variaveis categoricas 
dispostas em uma tabela de contingencia estao 
associadas. 

Teste t dependente: um teste utilizando a esta- 
tfstica t que determina se duas medias coletadas 
de amostras relacionadas (emparelhadas) diferem 
significativamente. 

Teste t independente: um teste usando a esta¬ 
tistica t que estabelece se duas medias coletadas 
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de amostras independentes diferem de forma 
significativa. 

Teste unilateral: um teste de hipoteses direcional. 
Por exemplo, a hipotese “quanto mais eu escrevo 
este glossario mais eu quero colocar os genitais 
do meu editor na boca de um crocodilo faminto” 
requer um teste unilateral porque estabeleci a 
diregao do relacionamento (veja tambem teste 
bilateral). 

Testes nao-parametricos: uma famflia de proce- 
dimentos estatisticos que nao depende das hipo¬ 
teses restritivas dos testes parametricos. Especifi- 
camente, eles nao presumem que os dados sejam 
provenientes de uma distribuigao normal. 

Testes post hoc : um conjunto de comparagoes 
entre as medias dos grupos que nao foram pla- 
nejadas antes dos dados serem coletados. Tipi- 
camente, esses testes envolvem a comparagao 
das medias de todas as combinagoes de pares das 
condigoes experimentais. Para compensar pelo 
numero de testes conduzidos, cada teste usa um 
criterio rfgido para a significancia. Assim, eles 
tendem a ter menos poder do que os contrastes 
planejados. Eles geralmente sao usados em traba- 
lhos exploratorios para os quais nenhuma hipotese 
firme estava disponfvel para ser base dos contras¬ 
tes planejados. 

Tolerancia: a estatistica de tolerancia mensura a 
multicolinearidade e e simplesmente o recfproco 
do fatorda inflagao da variancia (1/FIV). Valores 
abaixo de 0,1 indicam problemas serios, embora 
Menard (1995) sugira que valores abaixo de 0,2 
sao dignos de preocupagao. 

Trago de Pillai-Bartlett (V): um teste estatlstico 
na MANOVA. Ele e a soma da proporgao da va¬ 
riancia explicada na fungdo discriminante. Assim, 
ele e semelhante a razao SS M /SS T 

Transformagao: o processo de aplicar uma 
fungao matematica a todas as observagoes num 
conjunto de dados geralmente para corrigir alguma 
anormalidade da distribuigao tal como a assime- 
tria ou a curtose. 

Uma vida: o que voce nao tern quando escreve um 
livro de Estatistica. 

Univariada: isso significa “uma variavel” e e ge¬ 
ralmente usado para referir a situagoes nas quais 


somente uma variavel de salda foi medida. (isto e, 
AN OVA, testes t, testes de Mann-Whitney, etc.). 

V de Cramer: uma medida da forga do relacio¬ 
namento de uma associagao entre duas variaveis 
categdricas. Utilizado quando uma das variaveis 
tem mais do que duas categorias. E uma variagao 
do fi, usado quando uma ou ambas as variaveis 
contem mais de duas categorias, mas ofi falha ao 
nao alcangar seu valor mlnimo de 0 (indicando 
ausencia de relagao). 

Validagao cruzada: Determinagao da precisao de 
um modelo utilizando amostras diferentes. Ele e 
uma etapa importante na generalizagdo. Em um 
modelo de regressao, existem dois metodos princi¬ 
pals de validagao cruzada: R 2 ajustado ou divisao 
dos dados, em que os dados sao aleatoriamente 
separados em metades e o modelo de regressao e 
estimado entao com cada metade e os resultados 
comparados. 

Valor atlpico (outlier): uma observagao muito 
diferente da maioria. Valores atfpicos podem 
introduzir tendenciosidades como a media, por 
exemplo. 

Valor Chapeu: outro nome para a Influencia (Le¬ 
verage). 

Valor previsto ajustado: uma medida da influen¬ 
cia de um caso especffico de dados. E o valor pre¬ 
visto de um caso de um modelo estimado sem tal 
caso incluldo nos dados. O valor e calculado esti- 
mando novamente o modelo sem o caso em ques- 
tao e depois o modelo recalculado e utilizado para 
fazer uma previsao do caso excluido. Se o caso 
nao exerce uma grande influencia sobre o modelo, 
o valor previsto deve ser semelhante nao importa 
se o modelo foi estimado incluindo ou excluindo 
tal caso. A diferenga entre o valor previsto de um 
caso de um modelo quando o caso esta incluldo e 
o previsto quando ele esta excluido e o DFFit. 

Variancia: uma estimativa da variabilidade media 
(espalhamento) de um conjunto de dados. Ela e 
a soma dos quadrados dividida pelo numero dos 
valores menos 1. 

Variagao nao-sistematica: variagao que nao e 
devida ao efeito no qual estamos interessados 
(assim, ela pode ser devido as diferengas naturais 
entre pessoas em amostras diferentes, como as di¬ 
ferengas em inteligencia e motivagao). Voce pode 
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pensar nessa variagao como sendo a que nao pode 
ser explicada por qualquer modelo que ajustamos 
aos dados. 

Variagao sistematica: variagao devido a algum 
efeito genuino (seja esse efeito de um pesquisador 
fazendo algo a todos os participantes em uma 
amostra, mas nao em outras amostras ou a varia¬ 
gao natural entre conjuntos de variaveis). Pense 
nisso como a variagao que pode ser explicada pelo 
modelo que ajustamos aos dados. 

Variancia aleatoria: uma variancia unica a uma 
determinada variavel, mas que nao e muito confi- 
avel. 

Variancia comum: variancia compartilhada por 
duas ou mais variaveis. 

Variancia total: a variancia dentro de um conjun- 
to complete de observagoes. 

Variancia unica: variancia especifica a uma de¬ 
terminada variavel (isto e, nao e dividida com ou¬ 
tras variaveis). Temos a tendencia de usar o termo 
“variancia unica” para nos referirmos a variancia 
que pode ser atribufda com confianga a somente 
uma medida, de outro modo ela e chamada de va- 
riancia aleatoria. 

Variate fungao discriminante: uma combinagao 
linear de variaveis criadas de modo que a diferen- 
ga entre as medias dos grupos da variavel trans- 
formada e maximizada. Ela apresenta a seguinte 
forma geral: Variatej = bjX, + b 2 X 2 + b„X„. E uma 
combinagao linear (CL) de variaveis. 

Variaveis de texto: variaveis que envolvem pa- 
lavras (isto e, texto). Tais variaveis podem incluir 
respostas para questoes abertas como: “O quanto 
voce gosta de escrever um glossario?” a resposta 
poderia ser “Tanto quanto colocar meus testfculos 
no fogo”. 

Variaveis numericas: variaveis envolvendo nu- 
meros. 

Variavel auxiliar (dummy): uma maneira de 
recodificar uma variavel categorica com mais de 
duas categorias em uma serie de variaveis dicoto- 
micas e que podem assumir apenas os valores 0 
ou 1. Existem sete passos basicos para criar tais 
variaveis: (1) conte o numero de grupos que voce 
quer recodificar e subtraia; (2) crie tantas varia¬ 


veis quanto o valor que foi calculado no passo 1 
(essas sao as variaveis dummy): (3) escolha um 
dos grupos como base (isto e, um grupo contra o 
qual todos os demais serao comparados, como um 
grupo-controle); (4) atribua ao grupo-base o valor 
0 para todas as variaveis auxiliares; (5) para a pri- 
meira variavel auxiliar, atribua 1 para o primeiro 
grupo que voce quer comparer contra o grupo-base 
(atribua em todos os outros grupos 0 para essa va¬ 
riavel); (7) repita esse processo ate nao existirem 
mais variaveis auxiliares. 

Variavel categorica: qualquer variavel apresenta- 
da em categorias de objetos/entidades. O conceito 
e um exemplo de tal tipo de variavel. Uma apre- 
sentagao tfpica e: A, B, C, D e E, onde D e E signi¬ 
ficant reprovagao e os demais, aprovagao. 

Variavel de confusao: uma variavel (que pode 
ou nao ter sido mensurada) alem das variaveis 
previsoras em que estamos interessados que pode 
potencialmente afetar a variavel de saida. 

Variavel de saida: uma variavel cujos valores 
estamos tentando prever a partir de uma ou mais 
variaveis previsoras. 

Variavel dependente: outro nome para a variavel 
de saida. Esse nome esta normalmente associado 
a metodologia experimental (que e a unica vez 
em que ela realmente faz sentido) e e assim de- 
nominada em virtude de ser a variavel que nao e 
manipulada pelo pesquisador e assim seus valores 
dependem das variaveis que foram manipuladas. 
Para ser honesto, eu sempre utilizo a variavel de 
saida - faz mais sentido (para mim) e e menos 
confuso. 

Variavel independente: outro nome para uma 
variavel previsora. Esse nome e geralmente asso¬ 
ciado a metodologia experimental (que e a unica 
ocasiao em que ele faz sentido) e e assim chamado 
porque ela e a variavel manipulada pelo pesquisa¬ 
dor, portanto, seu valor nao depende de qualquer 
outre variavel (apenas do pesquisador). Uso a 
variavel previsora sempre porque o significado do 
termo nao e restrito a uma metodologia especifica. 

Variavel latente: uma variavel que nao pode ser 
mensurada diretamente, mas que supostamente 
esta relacionada a muitas variaveis que podem ser 
mensuradas. 
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Variavel previsora: uma variavel usada para 
tentar prever valores de outra variavel conhecida 
como variavel da saida. 

Varimax: um metodo de rotagao ortogonal. Ele 
tenta maximizar a dispersao das cargos dosfatores 
dentro dosfatores. Portanto, ele tenta carregar um 
numero pequeno de variaveis em cada fator resul- 
tando em uma melhor interpretagao de aglomera- 
dos de fatores. 

Verossimilhanga log: uma medida do erro ou da 
variagao nao-explicada em modelos categoricos. 
Ela e baseada na soma das probabilidades associa- 
da as safdas previstas e reais e e analoga a soma 
dos quadrados residuals na regressao multipla 
na qual ela e um indicador de quanta informagao 
nao-explicada ha apos o modelo ter sido ajustado. 
Valores altos da verossimilhanga log indicam mo¬ 
delos estatfsticos pouco ajustados porque quanto 
maior o valor da probabilidade log, mais observa¬ 
goes nao-explicadas existem. A verossimilhanga 
log e o logaritmo da verossimilhanga. 

Verossimilhanga: a probabilidade de obter um 
conjunto de observagoes dado os parametros de 
um modelo ajustado a essas observagoes. 

Visualizador da variavel: existem duas maneiras 
de ver os conteudos da janela do editor de dados. O 
visualizador de variaveis permite definir proprieda- 
des das variaveis para as quais voce quer entrar com 
dados (veja tambem visualizador de dados). 


Visualizador de dados (Data view): existem 
duas maneiras de visualizar os dados na janela de 
edigao de dados ( data editor window). A janela 
de visualizagao de dados mostra uma planilha que 
pode ser utilizada para entrar com os dados (veja 
tambem visualizador de variaveis). 

Visualizador: janela do SPSS na qual a saida de 
qualquer analise e apresentada. 

W de Kendall: E muito parecido com aANOVA 
de Friedman, mas e usado especialmente para 
observar a concordancia entre avaliadores. Assim, 
se, por exemplo, pedimos a 10 mulheres diferentes 
avaliarem a atratividade de Justin Timberlake, 
David Beckman e Tony Blair, podemos usar esse 
teste para analisar a extensao da concordancia. O 
W de Kendall varia de 0 (nenhuma concordancia 
entre os avaliadores) a 1 (concordancia completa 
entre os avaliadores). 

Z de Kolmogorov-Smirnov: nao deve ser confun- 
dido com o teste de Kolmogorov-Smirnov que testa 
se uma amostra vein de uma populagao normal- 
mente distribuida. Esse testa se dois grupos foram 
retirados da mesma populagao (independentemen- 
te de qual seja a populagao). Ele faz praticamente 
o mesmo que o teste de Mann-Whitney e o teste 
da soma dos postos de Wilcoxon ! Este teste tende 
a ter um poder maior do que o teste de Mann- 
Whitney quando o tamanho das amostras e menor 
do que 25 por grupo. 



APENDICE 


A.1 TABELA DA DISTRIBUIQAO NORMAL PAD RAO 



Estatistica Teste 


z 

Larger 

Portion 

Smaller 

Portion 

y 

Z 

Larger 

Portion 

Smaller 

Portion 

y 

0.00 

0.50000 

0.50000 

0.3989 

0.19 

0.57535 

0.42465 

0.3918 

0.01 

0.50399 

0.49601 

0.3989 

0.20 

0.57926 

0.42074 

0.3910 

0.02 

0.50798 

0.49202 

0.3989 

0.21 

0.58317 

0.41683 

0.3902 

0.03 

0.51197 

0.48803 

0.3988 

0.22 

0.58706 

0.41294 

0.3894 

0.04 

0.51595 

0.48405 

0.3986 

0.23 

0.59095 

0.40905 

0.3885 

0.05 

0.51994 

0.48006 

0.3984 

0.24 

0.59483 

0.40517 

0.3876 

0.06 

0.52392 

0.47608 

0.3982 

0.25 

0.59871 

0.40129 

0.3867 

0.07 

0.52790 

0.47210 

0.3980 

0.26 

0.60257 

0.39743 

0.3857 

0.08 

0.53188 

0.46812 

0.3977 

0.27 

0.60642 

0.39358 

0.3847 

0.09 

0.53586 

0.46414 

0.3973 

0.28 

0.61026 

0.38974 

0.3836 

0.10 

0.53983 

0.46017 

0.3970 

0.29 

0.61409 

0.38591 

0.3825 

0.11 

0.54380 

0.45620 

0.3965 

0.30 

0.61791 

0.38209 

0.3814 

0.12 

0.54776 

0.45224 

0.3961 

0.31 

0.62172 

0.37828 

0.3802 

0.13 

0.55172 

0.44828 

0.3956 

0.32 

0.62552 

0.37448 

0.3790 

0.14 

0.55567 

0.44433 

0.3951 

0.33 

0.62930 

0.37070 

0.3778 

0.15 

0.55962 

0.44038 

0.3945 

0.34 

0.63307 

0.36693 

0.3765 

0.16 

0.56356 

0.43644 

0.3939 

0.35 

0.63683 

0.36317 

0.3752 

0.17 

0.56749 

0.43251 

0.3932 

0.36 

0.64058 

0.35942 

0.3739 

0.18 

0.57142 

0.42858 

0.3925 

0.37 

0.64431 

0.35569 

0.3725 
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z 

Larger 

Portion 

Smaller 

Portion 

y 

Z 

Larger 

Portion 

Smaller 

Portion 

y 

0.38 

0.64803 

0.35197 

0.3712 

0.98 

0.83646 

0.16354 

0.2468 

0.39 

0.65173 

0.34827 

0.3697 

0.99 

0.83891 

0.16109 

0.2444 

0.40 

0.65542 

0.34458 

0.3683 

1.00 

0.84134 

0.15866 

0.2420 

0.41 

0.65910 

0.34090 

0.3668 

1.01 

0.84375 

0.15625 

0.2396 

0.42 

0.66276 

0.33724 

0.3653 

1.02 

0.84614 

0.15386 

0.2371 

0.43 

0.66640 

0.33360 

0.3637 

1.03 

0.84849 

0.15151 

0.2347 

0.44 

0.67003 

0.32997 

0.3621 

1.04 

0.85083 

0.14917 

0.2323 

0.45 

0.67364 

0.32636 

0.3605 

1.05 

0.85314 

0.14686 

0.2299 

0.46 

0.67724 

0.32276 

0.3589 

1.06 

0.85543 

0.14457 

0.2275 

0.47 

0.68082 

0.31918 

0.3572 

1.07 

0.85769 

0.14231 

0.2251 

0.48 

0.68439 

0.31561 

0.3555 

1.08 

0.85993 

0.14007 

0.2227 

0.49 

0.68793 

0.31207 

0.3538 

1.09 

0.86214 

0.13786 

0.2203 

0.50 

0.69146 

0.30854 

0.3521 

1.10 

0.86433 

0.13567 

0.2179 

0.51 

0.69497 

0.30503 

0.3503 

1.11 

0.86650 

0.13350 

0.2155 

0.52 

0.69847 

0.30153 

0.3485 

1.12 

0.86864 

0.13136 

0.2131 

0.53 

0.70194 

0.29806 

0.3467 

1.13 

0.87076 

0.12924 

0.2107 

0.54 

0.70540 

0.29460 

0.3448 

1.14 

0.87286 

0.12714 

0.2083 

0.55 

0.70884 

0.29116 

0.3429 

1.15 

0.87493 

0.12507 

0.2059 

0.56 

0.71226 

0.28774 

0.3410 

1.16 

0.87698 

0.12302 

0.2036 

0.57 

0.71566 

0.28434 

0.3391 

1.17 

0.87900 

0.12100 

0.2012 

0.58 

0.71904 

0.28096 

0.3372 

1.18 

0.88100 

0.11900 

0.1989 

0.59 

0.72240 

0.27760 

0.3352 

1.19 

0.88298 

0.11702 

0.1965 

0.60 

0.72575 

0.27425 

0.3332 

1.20 

0.88493 

0.11507 

0.1942 

0.61 

0.72907 

0.27093 

0.3312 

1.21 

0.88686 

0.11314 

0.1919 

0.62 

0.73237 

0.26763 

0.3292 

1.22 

0.88877 

0.11123 

0.1895 

0.63 

0.73565 

0.26435 

0.3271 

1.23 

0.89065 

0.10935 

0.1872 

0.64 

0.73891 

0.26109 

0.3251 

1.24 

0.89251 

0.10749 

0.1849 

0.65 

0.74215 

0.25785 

0.3230 

1.25 

0.89435 

0.10565 

0.1826 

0.66 

0.74537 

0.25463 

0.3209 

1.26 

0.89617 

0.10383 

0.1804 

0.67 

0.74857 

0.25143 

0.3187 

1.27 

0.89796 

0.10204 

0.1781 

0.68 

0.75175 

0.24825 

0.3166 

1.28 

0.89973 

0.10027 

0.1758 

0.69 

0.75490 

0.24510 

0.3144 

1.29 

0.90147 

0.09853 

0.1736 

0.70 

0.75804 

0.24196 

0.3123 

1.30 

0.90320 

0.09680 

0.1714 

0.71 

0.76115 

0.23885 

0.3101 

1.31 

0.90490 

0.09510 

0.1691 

0.72 

0.76424 

0.23576 

0.3079 

1.32 

0.90658 

0.09342 

0.1669 

0.73 

0.76730 

0.23270 

0.3056 

1.33 

0.90824 

0.09176 

0.1647 

0.74 

0.77035 

0.22965 

0.3034 

1.34 

0.90988 

0.09012 

0.1626 

0.75 

0.77337 

0.22663 

0.3011 

1.35 

0.91149 

0.08851 

0.1604 

0.76 

0.77637 

0.22363 

0.2989 

1.36 

0.91309 

0.08691 

0.1582 

0.77 

0.77935 

0.22065 

0.2966 

1.37 

0.91466 

0.08534 

0.1561 

0.78 

0.78230 

0.21770 

0.2943 

1.38 

0.91621 

0.08379 

0.1539 

0.79 

0.78524 

0.21476 

0.2920 

1.39 

0.91774 

0.08226 

0.1518 

0.80 

0.78814 

0.21186 

0.2897 

1.40 

0.91924 

0.08076 

0.1497 

0.81 

0.79103 

0.20897 

0.2874 

1.41 

0.92073 

0.07927 

0.1476 

0.82 

0.79389 

0.20611 

0.2850 

1.42 

0.92220 

0.07780 

0.1456 

0.83 

0.79673 

0.20327 

0.2827 

1.43 

0.92364 

0.07636 

0.1435 

0.84 

0.79955 

0.20045 

0.2803 

1.44 

0.92507 

0.07493 

0.1415 

0.85 

0.80234 

0.19766 

0.2780 

1.45 

0.92647 

0.07353 

0.1394 

0.86 

0.80511 

0.19489 

0.2756 

1.46 

0.92785 

0.07215 

0.1374 

0.87 

0.80785 

0.19215 

0.2732 

1.47 

0.92922 

0.07078 

0.1354 

0.88 

0.81057 

0.18943 

0.2709 

1.48 

0.93056 

0.06944 

0.1334 

0.89 

0.81327 

0.18673 

0.2685 

1.49 

0.93189 

0.06811 

0.1315 

0.90 

0.81594 

0.18406 

0.2661 

1.50 

0.93319 

0.06681 

0.1295 

0.91 

0.81859 

0.18141 

0.2637 

1.51 

0.93448 

0.06552 

0.1276 

0.92 

0.82121 

0.17879 

0.2613 

1.52 

0.93574 

0.06426 

0.1257 

0.93 

0.82381 

0.17619 

0.2589 

1.53 

0.93699 

0.06301 

0.1238 

0.94 

0.82639 

0.17361 

0.2565 

1.54 

0.93822 

0.06178 

0.1219 

0.95 

0.82894 

0.17106 

0.2541 

1.55 

0.93943 

0.06057 

0.1200 

0.96 

0.83147 

0.16853 

0.2516 

1.56 

0.94062 

0.05938 

0.1182 

0.97 

0.83398 

0.16602 

0.2492 

1.57 

0.94179 

0.05821 

0.1163 


[Continua) 
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z 

Larger 

Portion 

Smaller 

Portion 

y 

Z 

Larger 

Portion 

Smaller 

Portion 

y 

1.58 

0.94295 

0.05705 

0.1145 

2.18 

0.98537 

0.01463 

0.0371 

1.59 

0.94408 

0.05592 

0.1127 

2.19 

0.98574 

0.01426 

0.0363 

1.60 

0.94520 

0.05480 

0.1109 

2.20 

0.98610 

0.01390 

0.0355 

1.61 

0.94630 

0.05370 

0.1092 

2.21 

0.98645 

0.01355 

0.0347 

1.62 

0.94738 

0.05262 

0.1074 

2.22 

0.98679 

0.01321 

0.0339 

1.63 

0.94845 

0.05155 

0.1057 

2.23 

0.98713 

0.01287 

0.0332 

1.64 

0.94950 

0.05050 

0.1040 

2.24 

0.98745 

0.01255 

0.0325 

1.65 

0.95053 

0.04947 

0.1023 

2.25 

0.98778 

0.01222 

0.0317 

1.66 

0.95154 

0.04846 

0.1006 

2.26 

0.98809 

0.01191 

0.0310 

1.67 

0.95254 

0.04746 

0.0989 

2.27 

0.98840 

0.01160 

0.0303 

1.68 

0.95352 

0.04648 

0.0973 

2.28 

0.98870 

0.01130 

0.0297 

1.69 

0.95449 

0.04551 

0.0957 

2.29 

0.98899 

0.01101 

0.0290 

1.70 

0.95543 

0.04457 

0.0940 

2.30 

0.98928 

0.01072 

0.0283 

1.71 

0.95637 

0.04363 

0.0925 

2.31 

0.98956 

0.01044 

0.0277 

1.72 

0.95728 

0.04272 

0.0909 

2.32 

0.98983 

0.01017 

0.0270 

1.73 

0.95818 

0.04182 

0.0893 

2.33 

0.99010 

0.00990 

0.0264 

1.74 

0.95907 

0.04093 

0.0878 

2.34 

0.99036 

0.00964 

0.0258 

1.75 

0.95994 

0.04006 

0.0863 

2.35 

0.99061 

0.00939 

0.0252 

1.76 

0.96080 

0.03920 

0.0848 

2.36 

0.99086 

0.00914 

0.0246 

1.77 

0.96164 

0.03836 

0.0833 

2.37 

0.99111 

0.00889 

0.0241 

1.78 

0.96246 

0.03754 

0.0818 

2.38 

0.99134 

0.00866 

0.0235 

1.79 

0.96327 

0.03673 

0.0804 

2.39 

0.99158 

0.00842 

0.0229 

1.80 

0.96407 

0.03593 

0.0790 

2.40 

0.99180 

0.00820 

0.0224 

1.81 

0.96485 

0.03515 

0.0775 

2.41 

0.99202 

0.00798 

0.0219 

1.82 

0.96562 

0.03438 

0.0761 

2.42 

0.99224 

0.00776 

0.0213 

1.83 

0.96638 

0.03362 

0.0748 

2.43 

0.99245 

0.00755 

0.0208 

1.84 

0.96712 

0.03288 

0.0734 

2.44 

0.99266 

0.00734 

0.0203 

1.85 

0.96784 

0.03216 

0.0721 

2.45 

0.99286 

0.00714 

0.0198 

1.86 

0.96856 

0.03144 

0.0707 

2.46 

0.99305 

0.00695 

0.0194 

1.87 

0.96926 

0.03074 

0.0694 

2.47 

0.99324 

0.00676 

0.0189 

1.88 

0.96995 

0.03005 

0.0681 

2.48 

0.99343 

0.00657 

0.0184 

1.89 

0.97062 

0.02938 

0.0669 

2.49 

0.99361 

0.00639 

0.0180 

1.90 

0.97128 

0.02872 

0.0656 

2.50 

0.99379 

0.00621 

0.0175 

1.91 

0.97193 

0.02807 

0.0644 

2.51 

0.99396 

0.00604 

0.0171 

1.92 

0.97257 

0.02743 

0.0632 

2.52 

0.99413 

0.00587 

0.0167 

1.93 

0.97320 

0.02680 

0.0620 

2.53 

0.99430 

0.00570 

0.0163 

1.94 

0.97381 

0.02619 

0.0608 

2.54 

0.99446 

0.00554 

0.0158 

1.95 

0.97441 

0.02559 

0.0596 

2.55 

0.99461 

0.00539 

0.0154 

1.96 

0.97500 

0.02500 

0.0584 

2.56 

0.99477 

0.00523 

0.0151 

1.97 

0.97558 

0.02442 

0.0573 

2.57 

0.99492 

0.00508 

0.0147 

1.98 

0.97615 

0.02385 

0.0562 

2.58 

0.99506 

0.00494 

0.0143 

1.99 

0.97670 

0.02330 

0.0551 

2.59 

0.99520 

0.00480 

0.0139 

2.00 

0.97725 

0.02275 

0.0540 

2.60 

0.99534 

0.00466 

0.0136 

2.01 

0.97778 

0.02222 

0.0529 

2.61 

0.99547 

0.00453 

0.0132 

2.02 

0.97831 

0.02169 

0.0519 

2.62 

0.99560 

0.00440 

0.0129 

2.03 

0.97882 

0.02118 

0.0508 

2.63 

0.99573 

0.00427 

0.0126 

2.04 

0.97932 

0.02068 

0.0498 

2.64 

0.99585 

0.00415 

0.0122 

2.05 

0.97982 

0.02018 

0.0488 

2.65 

0.99598 

0.00402 

0.0119 

2.06 

0.98030 

0.01970 

0.0478 

2.66 

0.99609 

0.00391 

0.0116 

2.07 

0.98077 

0.01923 

0.0468 

2.67 

0.99621 

0.00379 

0.0113 

2.08 

0.98124 

0.01876 

0.0459 

2.68 

0.99632 

0.00368 

0.0110 

2.09 

0.98169 

0.01831 

0.0449 

2.69 

0.99643 

0.00357 

0.0107 

2.10 

0.98214 

0.01786 

0.0440 

2.70 

0.99653 

0.00347 

0.0104 

2.11 

0.98257 

0.01743 

0.0431 

2.71 

0.99664 

0.00336 

0.0101 

2.12 

0.98300 

0.01700 

0.0422 

2.72 

0.99674 

0.00326 

0.0099 

2.13 

0.98341 

0.01659 

0.0413 

2.73 

0.99683 

0.00317 

0.0096 

2.14 

0.98382 

0.01618 

0.0404 

2.74 

0.99693 

0.00307 

0.0093 

2.15 

0.98422 

0.01578 

0.0396 

2.75 

0.99702 

0.00298 

0.0091 

2.16 

0.98461 

0.01539 

0.0387 

2.76 

0.99711 

0.00289 

0.0088 

2.17 

0.98500 

0.01500 

0.0379 

2.77 

0.99720 

0.00280 

0.0086 


[Continua) 
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z 

Larger 

Portion 

Smaller 

Portion 

y 

2.78 

0.99728 

0.00272 

0.0084 

2.79 

0.99736 

0.00264 

0.0081 

2.80 

0.99744 

0.00256 

0.0079 

2.81 

0.99752 

0.00248 

0.0077 

2.82 

0.99760 

0.00240 

0.0075 

2.83 

0.99767 

0.00233 

0.0073 

2.84 

0.99774 

0.00226 

0.0071 

2.85 

0.99781 

0.00219 

0.0069 

2.86 

0.99788 

0.00212 

0.0067 

2.87 

0.99795 

0.00205 

0.0065 

2.88 

0.99801 

0.00199 

0.0063 

2.89 

0.99807 

0.00193 

0.0061 

2.90 

0.99813 

0.00187 

0.0060 

2.91 

0.99819 

0.00181 

0.0058 

2.92 

0.99825 

0.00175 

0.0056 


Z 

Larger 

Portion 

Smaller 

Portion 

y 

2.93 

0.99831 

0.00169 

0.0055 

2.94 

0.99836 

0.00164 

0.0053 

2.95 

0.99841 

0.00159 

0.0051 

2.96 

0.99846 

0.00154 

0.0050 

2.97 

0.99851 

0.00149 

0.0048 

2.98 

0.99856 

0.00144 

0.0047 

2.99 

0.99861 

0.00139 

0.0046 

3.00 

0.99865 

0.00135 

0.0044 

3.25 

0.99942 

0.00058 

0.0020 

3.50 

0.99977 

0.00023 

0.0009 

4.00 

0.99997 

0.00003 

0.0001 
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A.2 VALORES CRITICOS DA DISTRIBUIQAO T 


gi 

Two-Tailed Test 
(Teste Bilateral) 

One-Tailed Test 
(Teste Unilateral) 

0.05 

0.01 

0.05 

0.01 

i 

12.71 

63.66 

6.31 

31.82 

2 

4.30 

9.92 

2.92 

6.96 

3 

3.18 

5.84 

2.35 

4.54 

4 

2.78 

4.60 

2.13 

3.75 

5 

2.57 

4.03 

2.02 

3.36 

6 

2.45 

3.71 

1.94 

3.14 

7 

2.36 

3.50 

1.89 

3.00 

8 

2.31 

3.36 

1.86 

2.90 

9 

2.26 

3.25 

1.83 

2.82 

10 

2.23 

3.17 

1.81 

2.76 

11 

2.20 

3.11 

1.80 

2.72 

12 

2.18 

3.05 

1.78 

2.68 

13 

2.16 

3.01 

1.77 

2.65 

14 

2.14 

2.98 

1.76 

2.62 

15 

2.13 

2.95 

1.75 

2.60 

16 

2.12 

2.92 

1.75 

2.58 

17 

2.11 

2.90 

1.74 

2.57 

18 

2.10 

2.88 

1.73 

2.55 

19 

2.09 

2.86 

1.73 

2.54 

20 

2.09 

2.85 

1.72 

2.53 

21 

2.08 

2.83 

1.72 

2.52 

22 

2.07 

2.82 

1.72 

2.51 

23 

2.07 

2.81 

1.71 

2.50 

24 

2.06 

2.80 

1.71 

2.49 

25 

2.06 

2.79 

1.71 

2.49 

26 

2.06 

2.78 

1.71 

2.48 

27 

2.05 

2.77 

1.70 

2.47 

28 

2.05 

2.76 

1.70 

2.47 

29 

2.05 

2.76 

1.70 

2.46 

30 

2.04 

2.75 

1.70 

2.46 

35 

2.03 

2.72 

1.69 

2.44 

40 

2.02 

2.70 

1.68 

2.42 

45 

2.01 

2.69 

1.68 

2.41 

50 

2.01 

2.68 

1.68 

2.40 

60 

2.00 

2.66 

1.67 

2.39 

70 

1.99 

2.65 

1.67 

2.38 

80 

1.99 

2.64 

1.66 

2.37 

90 

1.99 

2.63 

1.66 

2.37 

100 

1.98 

2.63 

1.66 

2.36 

°°(z) 

1.96 

2.58 

1.64 

2.33 


Todos os valores foram calculados pelo autor usando o SPSS 11. 
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A.3 VALORES CRITICOS DA DISTRIBUIQAO F 








gl (numerador) 








P 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 


1 

0.05 

161.45 

199.50 

215.71 

224.58 

230.16 

233.99 

236.77 

238.88 

240.54 

241.88 



0.01 

4052.18 

4999.50 

5403.35 

5624.58 

5763.65 

5858.99 

5928.36 

5981.07 

6022.47 

6055.85 


2 

0.05 

18.51 

19.00 

19.16 

19.25 

19.30 

19.33 

19.35 

19.37 

19.38 

19.40 



0.01 

98.50 

99.00 

99.17 

99.25 

99.30 

99.33 

99.36 

99.37 

99.39 

99.40 


3 

0.05 

10.13 

9.55 

9.28 

9.12 

9.01 

8.94 

8.89 

8.85 

8.81 

8.79 



0.01 

34.12 

30.82 

29.46 

28.71 

28.24 

27.91 

27.67 

27.49 

27.35 

27.23 


4 

0.05 

7.71 

6.94 

6.59 

6.39 

6.26 

6.16 

6.09 

6.04 

6.00 

5.96 



0.01 

21.20 

18.00 

16.69 

15.98 

15.52 

15.21 

14.98 

14.80 

14.66 

14.55 


5 

0.05 

6.61 

5.79 

5.41 

5.19 

5.05 

4.95 

4.88 

4.82 

4.77 

4.74 



0.01 

16.26 

13.27 

12.06 

11.39 

10.97 

10.67 

10.46 

10.29 

10.16 

10.05 


6 

0.05 

5.99 

5.14 

4.76 

4.53 

4.39 

4.28 

4.21 

4.15 

4.10 

4.06 



0.01 

13.75 

10.92 

9.78 

9.15 

8.75 

8.47 

8.26 

8.10 

7.98 

7.87 


7 

0.05 

5.59 

4.74 

4.35 

4.12 

3.97 

3.87 

3.79 

3.73 

3.68 

3.64 



0.01 

12.25 

9.55 

8.45 

7.85 

7.46 

7.19 

6.99 

6.84 

6.72 

6.62 


8 

0.05 

5.32 

4.46 

4.07 

3.84 

3.69 

3.58 

3.50 

3.44 

3.39 

3.35 



0.01 

11.26 

8.65 

7.59 

7.01 

6.63 

6.37 

6.18 

6.03 

5.91 

5.81 


9 

0.05 

5.12 

4.26 

3.86 

3.63 

3.48 

3.37 

3.29 

3.23 

3.18 

3.14 



0.01 

10.56 

8.02 

6.99 

6.42 

6.06 

5.80 

5.61 

5.47 

5.35 

5.26 

IT 

10 

0.05 

4.96 

4.10 

3.71 

3.48 

3.33 

3.22 

3.14 

3.07 

3.02 

2.98 

"O 

CD 


0.01 

10.04 

7.56 

6.55 

5.99 

5.64 

5.39 

5.20 

5.06 

4.94 

4.85 

C 

£ 

11 

0.05 

4.84 

3.98 

3.59 

3.36 

3.20 

3.09 

3.01 

2.95 

2.90 

2.85 

o 

c 


0.01 

9.65 

7.21 

6.22 

5.67 

5.32 

5.07 

4.89 

4.74 

4.63 

4.54 

2, 

12 

0.05 

4.75 

3.89 

3.49 

3.26 

3.11 

3.00 

2.91 

2.85 

2.80 

2.75 



0.01 

9.33 

6.93 

5.95 

5.41 

5.06 

4.82 

4.64 

4.50 

4.39 

4.30 


13 

0.05 

4.67 

3.81 

3.41 

3.18 

3.03 

2.92 

2.83 

2.77 

2.71 

2.67 



0.01 

9.07 

6.70 

5.74 

5.21 

4.86 

4.62 

4.44 

4.30 

4.19 

4.10 


14 

0.05 

4.60 

3.74 

3.34 

3.11 

2.96 

2.85 

2.76 

2.70 

2.65 

2.60 



0.01 

8.86 

6.51 

5.56 

5.04 

4.69 

4.46 

4.28 

4.14 

4.03 

3.94 


15 

0.05 

4.54 

3.68 

3.29 

3.06 

2.90 

2.79 

2.71 

2.64 

2.59 

2.54 



0.01 

8.68 

6.36 

5.42 

4.89 

4.56 

4.32 

4.14 

4.00 

3.89 

3.80 


16 

0.05 

4.49 

3.63 

3.24 

3.01 

2.85 

2.74 

2.66 

2.59 

2.54 

2.49 



0.01 

8.53 

6.23 

5.29 

4.77 

4.44 

4.20 

4.03 

3.89 

3.78 

3.69 


17 

0.05 

4.45 

3.59 

3.20 

2.96 

2.81 

2.70 

2.61 

2.55 

2.49 

2.45 



0.01 

8.40 

6.11 

5.18 

4.67 

4.34 

4.10 

3.93 

3.79 

3.68 

3.59 


18 

0.05 

4.41 

3.55 

3.16 

2.93 

2.77 

2.66 

2.58 

2.51 

2.46 

2.41 



0.01 

8.29 

6.01 

5.09 

4.58 

4.25 

4.01 

3.84 

3.71 

3.60 

3.51 


19 

0.05 

4.38 

3.52 

3.13 

2.90 

2.74 

2.63 

2.54 

2.48 

2.42 

2.38 



0.01 

8.18 

5.93 

5.01 

4.50 

4.17 

3.94 

3.77 

3.63 

3.52 

3.43 


20 

0.05 

4.35 

3.49 

3.10 

2.87 

2.71 

2.60 

2.51 

2.45 

2.39 

2.35 



0.01 

8.10 

5.85 

4.94 

4.43 

4.10 

3.87 

3.70 

3.56 

3.46 

3.37 


22 

0.05 

4.30 

3.44 

3.05 

2.82 

2.66 

2.55 

2.46 

2.40 

2.34 

2.30 



0.01 

7.95 

5.72 

4.82 

4.31 

3.99 

3.76 

3.59 

3.45 

3.35 

3.26 


( Continua ) 
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gl (numerador) 








P 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 


24 

0.05 

4.26 

3.40 

3.01 

2.78 

2.62 

2.51 

2.42 

2.36 

2.30 

2.25 



0.01 

7.82 

5.61 

4.72 

4.22 

3.90 

3.67 

3.50 

3.36 

3.26 

3.17 


26 

0.05 

4.23 

3.37 

2.98 

2.74 

2.59 

2.47 

2.39 

2.32 

2.27 

2.22 



0.01 

7.72 

5.53 

4.64 

4.14 

3.82 

3.59 

3.42 

3.29 

3.18 

3.09 


28 

0.05 

4.20 

3.34 

2.95 

2.71 

2.56 

2.45 

2.36 

2.29 

2.24 

2.19 



0.01 

7.64 

5.45 

4.57 

4.07 

3.75 

3.53 

3.36 

3.23 

3.12 

3.03 


30 

0.05 

4.17 

3.32 

2.92 

2.69 

2.53 

2.42 

2.33 

2.27 

2.21 

2.16 



0.01 

7.56 

5.39 

4.51 

4.02 

3.70 

3.47 

3.30 

3.17 

3.07 

2.98 


35 

0.05 

4.12 

3.27 

2.87 

2.64 

2.49 

2.37 

2.29 

2.22 

2.16 

2.11 



0.01 

7.42 

5.27 

4.40 

3.91 

3.59 

3.37 

3.20 

3.07 

2.96 

2.88 


40 

0.05 

4.08 

3.23 

2.84 

2.61 

2.45 

2.34 

2.25 

2.18 

2.12 

2.08 



0.01 

7.31 

5.18 

4.31 

3.83 

3.51 

3.29 

3.12 

2.99 

2.89 

2.80 


45 

0.05 

4.06 

3.20 

2.81 

2.58 

2.42 

2.31 

2.22 

2.15 

2.10 

2.05 

~o 

cc 


0.01 

7.23 

5.11 

4.25 

3.77 

3.45 

3.23 

3.07 

2.94 

2.83 

2.74 

c 

E 

50 

0.05 

4.03 

3.18 

2.79 

2.56 

2.40 

2.29 

2.20 

2.13 

2.07 

2.03 

o 

c 

a) 

3 


0.01 

7.17 

5.06 

4.20 

3.72 

3.41 

3.19 

3.02 

2.89 

2.78 

2.70 

60 

0.05 

4.00 

3.15 

2.76 

2.53 

2.37 

2.25 

2.17 

2.10 

2.04 

1.99 

"a> 


0.01 

7.08 

4.98 

4.13 

3.65 

3.34 

3.12 

2.95 

2.82 

2.72 

2.63 


80 

0.05 

3.96 

3.11 

2.72 

2.49 

2.33 

2.21 

2.13 

2.06 

2.00 

1.95 



0.01 

6.96 

4.88 

4.04 

3.56 

3.26 

3.04 

2.87 

2.74 

2.64 

2.55 


100 

0.05 

3.94 

3.09 

2.70 

2.46 

2.31 

2.19 

2.10 

2.03 

1.97 

1.93 



0.01 

6.90 

4.82 

3.98 

3.51 

3.21 

2.99 

2.82 

2.69 

2.59 

2.50 


150 

0.05 

3.90 

3.06 

2.66 

2.43 

2.27 

2.16 

2.07 

2.00 

1.94 

1.89 



0.01 

6.81 

4.75 

3.91 

3.45 

3.14 

2.92 

2.76 

2.63 

2.53 

2.44 


300 

0.05 

3.87 

3.03 

2.63 

2.40 

2.24 

2.13 

2.04 

1.97 

1.91 

1.86 



0.01 

6.72 

4.68 

3.85 

3.38 

3.08 

2.86 

2.70 

2.57 

2.47 

2.38 


500 

0.05 

3.86 

3.01 

2.62 

2.39 

2.23 

2.12 

2.03 

1.96 

1.90 

1.85 



0.01 

6.69 

4.65 

3.82 

3.36 

3.05 

2.84 

2.68 

2.55 

2.44 

2.36 


1000 

0.05 

3.85 

3.00 

2.61 

2.38 

2.22 

2.11 

2.02 

1.95 

1.89 

1.84 



0.01 

6.66 

4.63 

3.80 

3.34 

3.04 

2.82 

2.66 

2.53 

2.43 

2.34 


gl (numerador) 



P 

15 

20 

25 

30 

40 

50 

1000 

1 

0.05 

245.95 

248.01 

249.26 

250.10 

251.14 

251.77 

254.19 


0.01 

6157.31 

6208.74 

6239.83 

6260.65 

6286.79 

6302.52 

6362.70 

2 

0.05 

19.43 

19.45 

19.46 

19.46 

19.47 

19.48 

19.49 


0.01 

99.43 

99.45 

99.46 

99.47 

99.47 

99.48 

99.50 

3 

0.05 

8.70 

8.66 

8.63 

8.62 

8.59 

8.58 

8.53 


0.01 

26.87 

26.69 

26.58 

26.50 

26.41 

26.35 

26.14 

4 

0.05 

5.86 

5.80 

5.77 

5.75 

5.72 

5.70 

5.63 


0.01 

14.20 

14.02 

13.91 

13.84 

13.75 

13.69 

13.47 

5 

0.05 

4.62 

4.56 

4.52 

4.50 

4.46 

4.44 

4.37 


0.01 

9.72 

9.55 

9.45 

9.38 

9.29 

9.24 

9.03 


( Continua ) 
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gl (numerador) 



P 

15 

20 

25 

30 

40 

50 

1000 

6 

0.05 

3.94 

3.87 

3.83 

3.81 

3.77 

3.75 

3.67 


0.01 

7.56 

7.40 

7.30 

7.23 

7.14 

7.09 

6.89 

7 

0.05 

3.51 

3.44 

3.40 

3.38 

3.34 

3.32 

3.23 


0.01 

6.31 

6.16 

6.06 

5.99 

5.91 

5.86 

5.66 

8 

0.05 

3.22 

3.15 

3.11 

3.08 

3.04 

3.02 

2.93 


0.01 

5.52 

5.36 

5.26 

5.20 

5.12 

5.07 

4.87 

9 

0.05 

3.01 

2.94 

2.89 

2.86 

2.83 

2.80 

2.71 


0.01 

4.96 

4.81 

4.71 

4.65 

4.57 

4.52 

4.32 

10 

0.05 

2.85 

2.77 

2.73 

2.70 

2.66 

2.64 

2.54 


0.01 

4.56 

4.41 

4.31 

4.25 

4.17 

4.12 

3.92 

11 

0.05 

2.72 

2.65 

2.60 

2.57 

2.53 

2.51 

2.41 


0.01 

4.25 

4.10 

4.01 

3.94 

3.86 

3.81 

3.61 

12 

0.05 

2.62 

2.54 

2.50 

2.47 

2.43 

2.40 

2.30 


0.01 

4.01 

3.86 

3.76 

3.70 

3.62 

3.57 

3.37 

13 

0.05 

2.53 

2.46 

2.41 

2.38 

2.34 

2.31 

2.21 


0.01 

3.82 

3.66 

3.57 

3.51 

3.43 

3.38 

3.18 

14 

0.05 

2.46 

2.39 

2.34 

2.31 

2.27 

2.24 

2.14 


0.01 

3.66 

3.51 

3.41 

3.35 

3.27 

3.22 

3.02 

15 

0.05 

2.40 

2.33 

2.28 

2.25 

2.20 

2.18 

2.07 


0.01 

3.52 

3.37 

3.28 

3.21 

3.13 

3.08 

2.88 

16 

0.05 

2.35 

2.28 

2.23 

2.19 

2.15 

2.12 

2.02 


0.01 

3.41 

3.26 

3.16 

3.10 

3.02 

2.97 

2.76 

17 

0.05 

2.31 

2.23 

2.18 

2.15 

2.10 

2.08 

1.97 


0.01 

3.31 

3.16 

3.07 

3.00 

2.92 

2.87 

2.66 

18 

0.05 

2.27 

2.19 

2.14 

2.11 

2.06 

2.04 

1.92 


0.01 

3.23 

3.08 

2.98 

2.92 

2.84 

2.78 

2.58 

19 

0.05 

2.23 

2.16 

2.11 

2.07 

2.03 

2.00 

1.88 


0.01 

3.15 

3.00 

2.91 

2.84 

2.76 

2.71 

2.50 

20 

0.05 

2.20 

2.12 

2.07 

2.04 

1.99 

1.97 

1.85 


0.01 

3.09 

2.94 

2.84 

2.78 

2.69 

2.64 

2.43 

22 

0.05 

2.15 

2.07 

2.02 

1.98 

1.94 

1.91 

1.79 


0.01 

2.98 

2.83 

2.73 

2.67 

2.58 

2.53 

2.32 

24 

0.05 

2.11 

2.03 

1.97 

1.94 

1.89 

1.86 

1.74 


0.01 

2.89 

2.74 

2.64 

2.58 

2.49 

2.44 

2.22 

26 

0.05 

2.07 

1.99 

1.94 

1.90 

1.85 

1.82 

1.70 


0.01 

2.81 

2.66 

2.57 

2.50 

2.42 

2.36 

2.14 

28 

0.05 

2.04 

1.96 

1.91 

1.87 

1.82 

1.79 

1.66 


0.01 

2.75 

2.60 

2.51 

2.44 

2.35 

2.30 

2.08 

30 

0.05 

2.01 

1.93 

1.88 

1.84 

1.79 

1.76 

1.63 


0.01 

2.70 

2.55 

2.45 

2.39 

2.30 

2.25 

2.02 

35 

0.05 

1.96 

1.88 

1.82 

1.79 

1.74 

1.70 

1.57 


0.01 

2.60 

2.44 

2.35 

2.28 

2.19 

2.14 

1.90 

40 

0.05 

1.92 

1.84 

1.78 

1.74 

1.69 

1.66 

1.52 


0.01 

2.52 

2.37 

2.27 

2.20 

2.11 

2.06 

1.82 


(Continua) 
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gl (numerador) 



P 

15 

20 

25 

30 

40 

50 

1000 

45 

0.05 

1.89 

1.81 

1.75 

1.71 

1.66 

1.63 

1.48 


0.01 

2.46 

2.31 

2.21 

2.14 

2.05 

2.00 

1.75 

50 

0.05 

1.87 

1.78 

1.73 

1.69 

1.63 

1.60 

1.45 


0.01 

2.42 

2.27 

2.17 

2.10 

2.01 

1.95 

1.70 

60 

0.05 

1.84 

1.75 

1.69 

1.65 

1.59 

1.56 

1.40 


0.01 

2.35 

2.20 

2.10 

2.03 

1.94 

1.88 

1.62 

80 

0.05 

1.79 

1.70 

1.64 

1.60 

1.54 

1.51 

1.34 


0.01 

2.27 

2.12 

2.01 

1.94 

1.85 

1.79 

1.51 

100 

0.05 

1.77 

1.68 

1.62 

1.57 

1.52 

1.48 

1.30 


0.01 

2.22 

2.07 

1.97 

1.89 

1.80 

1.74 

1.45 

150 

0.05 

1.73 

1.64 

1.58 

1.54 

1.48 

1.44 

1.24 


0.01 

2.16 

2.00 

1.90 

1.83 

1.73 

1.66 

1.35 

300 

0.05 

1.70 

1.61 

1.54 

1.50 

1.43 

1.39 

1.17 


0.01 

2.10 

1.94 

1.84 

1.76 

1.66 

1.59 

1.25 

500 

0.05 

1.69 

1.59 

1.53 

1.48 

1.42 

1.38 

1.14 


0.01 

2.07 

1.92 

1.81 

1.74 

1.63 

1.57 

1.20 

1000 

0.05 

1.68 

1.58 

1.52 

1.47 

1.41 

1.36 

1.11 


0.01 

2.06 

1.90 

1.79 

1.72 

1.61 

1.54 

1.16 


Todos os valores foram calculados pelo autor usando o SPSS 11. 


A.4 VALORES CRITICOS DA 
DISTRIBUIQAO QUI-QUADRADO 


gi 

P 


gi 

P 


0.05 

0.01 

0.05 

0.01 

i 

3.84 

6.63 

25 

37.65 

44.31 

2 

5.99 

9.21 

26 

38.89 

45.64 

3 

7.81 

11.34 

27 

40.11 

46.96 

4 

9.49 

13.28 

28 

41.34 

48.28 

5 

11.07 

15.09 

29 

42.56 

49.59 

6 

12.59 

16.81 

30 

43.77 

50.89 

7 

14.07 

18.48 

35 

49.80 

57.34 

8 

15.51 

20.09 

40 

55.76 

63.69 

9 

16.92 

21.67 

45 

61.66 

69.96 

10 

18.31 

23.21 

50 

67.50 

76.15 

11 

19.68 

24.72 

60 

79.08 

88.38 

12 

21.03 

26.22 

70 

90.53 

100.43 

13 

22.36 

27.69 

80 

101.88 

112.33 

14 

23.68 

29.14 

90 

113.15 

124.12 

15 

25.00 

30.58 

100 

124.34 

135.81 

16 

26.30 

32.00 

200 

233.99 

249.45 

17 

27.59 

33.41 

300 

341.40 

359.91 

18 

28.87 

34.81 

400 

447.63 

468.72 

19 

30.14 

36.19 

500 

553.13 

576.49 

20 

31.41 

37.57 

600 

658.09 

683.52 

21 

32.67 

38.93 

700 

762.66 

789.97 

22 

33.92 

40.29 

800 

866.91 

895.98 

23 

35.17 

41.64 

900 

970.90 

1001.63 

24 

36.42 

42.98 

1000 

1074.68 

1106.97 


A.5 0 TESTE F DE WELCH 

Veja o arquivo Welch F.pdf no site www. 
artmed.com.br. 

A.6 CALCULANDO EFEITOS SIMPLES 

Veja o arquivo Calculating Simple 
Effects.pdf no site www.artmed.com.br. 

A.7 TESTE DA TENDENCIA DE 
JONCKHEERE 

Veja o arquivo Jonckheere.pdf no site 
www.artmed.com.br. 

A.8 CAPITULO 14 

Veja o arquivo Appendix Chapter 14.pdf 

no site www.artmed.com.br. 

A.9 CALCULOS DOS COEFICIENTES DOS 
ESCORES DOS FATORES 

Veja o arquivo Factor Scores.pdf no site 
www.artmed.com.br. 
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148-153, 171-172, 182-183, 
200-202, 224-225,641-665 
Correla 9 ao Ponto Bisserial 145- 
149, 153-154, 212-213, 258- 
259, 285-286, 641-665 
Correla 9 ao Semiparcial 153, 
170-172, 187,641-665 
p de Spearman 138-140, 144- 
146, 153-154,641-665 
rde Pearson 56-58, 127-129, 
138-148, 151-154, 161-162, 
165-166, 175-176, 182-183, 
187, 191-194, 200-201,212- 
213,223-224, 238, 258,284- 
286, 292-294, 309-310, 337- 
339, 360-362, 388,415-416, 
437-438, 467-469,482-484, 
490, 501-503, 509-511,553- 
559, 569-570, 577-579,641- 
665 

Tau de Kendall 138-140, 145- 
146, 153-154, 612-613, 641- 
665 

Correla 9 ao Bisserial 145-149, 
641-665 

Correla 9 ao Bivariada 641-665, 
veja Correla 9 ao 
Correla 9 ao Canonica 546-547 
Correla 9 ao de Ordem Zero 151- 
153, 187,200-201 
Correla 9 ao Parcial de Segunda 
Ordem 151-153 

Correla 9 ao Parcial de Terceira Or¬ 
dem 151-153 

Correla 9 ao Parcial veja Correla 9 ao 
Correla 9 ao Ponto Bisserial 641 - 
665, veja Correla 9 ao 
Correla 9 ao Semiparcial veja Cor- 
rela9ao 

Corridas de Wald-Wolfowitz 479- 

481.641- 665 
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Covariancia 125-128, 538-540, 
641-665 

Covariavel 343-344, 352-353, 
531-533,641-665 
Criterio de Kaiser 564-565, 574- 
575,580-581,583,587,641-665 
Curtose 36-39, 92-94, 107-109, 
111-113, 115-116, 120,641-665 
Leptociirtica 37-39, 88-89, 641- 
665 

Platicurtica 37-39, 531, 641-665 

D 

d de Cohen 56-57 
Dados de Razao 71-72, 641-665 
Dados Intervalares 71-72, 85-86, 
140-141, 144-145, 178, 280, 309- 
310, 641-665 

Dados Nominais 71-72, 641-665 
Dados omissos ( missing data) ou 
dados faltantes 190-191 
Dados Ordinais 71-72, 144-145, 
641-665 

Dados Parametricos 139-140 
Delineamento de Medidas Repeti- 
das 266-268, 364-365, 395-440, 
641-665 

Delineamento entre grupos 266- 
268, 641-665 

Delineamento entre Participantes, 
veja Delineamento entre Grupos 
Delineamento Independente veja 
Delineamento entre Grupos 641 - 
665 

Delineamento Misto 364-365, 
441-472, 641-665 
Delineamentos desbalanceados 
322-323, 370-372,406-407 
Delineamentos Relacionados 
641-665, veja Delineamentos de 
Medidas Repetidas 
Desvio 33-34, 36-37, 159-160, 
304-305, 606-607,641-665 
Desvio Padrao 35-42, 44, 92-96, 
99, 107-109, 111-113, 115-116, 
120, 127-129, 187, 191, 199-200, 
328, 328-330,641-665 
Desvios dos Produtos Cruzados 
126-127, 139-140,518-519, 521- 
526,538-540,641-665 
Modelo(CP M ) 521-525 
Residual (CP R ) 521-525 
Total (CP T ) 521-523 


Determinante 571-572, 577-579 
DFBeta 175-176, 206-208, 244, 
246-247, 641-665, veja tambem 
DFBeta Padronizado 
DFBeta Padronizado 175-176, 
189-191, 641-665, veja tambem 
DFBeta 

DFFit Padronizado 176-178, 189- 
191, 641-665, veja tambem DFFit 
Diagnosticos porcasos 187-188, 
204-208 

Diagrama de barras 87-88, 92-96, 
99, 119-123, 269-270, 328, 376, 
384-386 

Diagrama de Caixa e Bigodes 
(Boxplot) 87-92, 96, 99-97, 113- 
114, 496-497,641-665 
Diagrama de Classifica 9 ao 232- 
233,240-242, 251,253-254 
Diagrama de Declividade 564-565, 
573-575, 583-584, 587, 641-665 
Diagrama de Dispersao 47-48, 89- 
91, 129-138, 163-165, 159-160, 
168-169, 177, 188-189, 202-203, 
210-211, 352-353, 357-358, 641- 
665 

Diagrama de Dispersao em 3D 
Diagrama de Dispersao Sobrepos- 
to 134-136 

Diagrama de Pizza 87-88, 92-93 
Diferemja Honestamente Signifi- 
cativa (DHS) de Tukey 322-324, 
327-328, 334-338, 347-348 
Diferenija Minimamente Signifi- 
cativa (DHM) de Tukey 322-323, 
407-408, 427-429 
Distanciade Cook 175-176, 189- 
191,205-208, 244, 246-247, 
641-665 

Distancia de Mahalanobis 174- 
175, 189-191, 205-208, 641-665 
Distribu^ao Amostral 42, 44, 280- 
281,641-665 

Distribu^ao de Frequencia/ His- 
tograma 36-37, 86-93, 107-114, 
188-189, 207-212, 232-233, 240- 
241,281-282,641-665 
Distribui£ao de Probabilidade 41- 
42, 641-665 

Distribu^ao Normal 36-42, 85-86, 
140-141,202-203,641-665 
Verifica 9 ao da Nonnalidade 
93-95, 112-116, veja tambem 


Teste de Kolmogorov-Smirnov, 
teste de Shapiro-Wilk 
Distribuifao Qui-Quadrado 224- 
226, 235-236, 238,493, 506-508, 
608-609, 641-665 
Divisao pela Mediana 290-291 
DMS (Diferen 9 a Menos Significa- 
tiva) ou LSD veja Least Signifi¬ 
cant Difference 

E 

E veja SSCP 
E" 1 veja SSCP 

Efeito alcool ( beer goggles ) 365- 
389, 641-665 

Efeito Pratico 268-269, 641-665 
Efeito Principal 359-360, 367-369, 
376-380, 383-384, 427-431,447- 
448, 450-456,469-470, 641-665 
Efeito Tedio 268-269, 641-665 
Efeitos Supressores 171-172, 227- 
228, 641-665 
Eixox 129-130, 575-576 
Eixoy 129-130, 575-576 
Encolhimento 180-181, 194-195. 
641-665 

Entrada For 9 ada 170-171, 227 
Entre participantes 641-665, veja 
Medidas Repetidas 
Equa 9 ao de Wherry 180-181 
Erro do SSCP veja SSCP 
Erro do Tipo 155-56, 298-299, 
309-310, 322-324, 328-330,405- 
407,412, 483-484,496-498, 514- 
515,531,537-538,609,641-665 
Erro Padrao da Media 42-45, 191, 
197, 199-200, 212, 225-226, 246- 
247, 270-271, 278-282. 288, 328- 
330, 333-336, 641-665 
Erro Padrao das Diferenfas 281 - 
283, 641-665 

Erros Independentes (Supos^ao 
de) 178-179, 186-188, 195-197, 
641-665 

Escores Discriminantes 544-548, 
641-665 

Escores dos Fatores 558-561. 575- 
579, 590-593, 641-665 
Escores-z 41-42,45-47,93-94, 97, 
99-100, 107-109, 174,476-477, 
481-484,488-491, 498-503, 508- 
511, 628-629, 632-633, 641-665 
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Esfericidade 395-399, 405-406, 
408-411, 416-417, 426-429,437, 
641-665, veja tambem Teste de 
Bartlett, Corre^ao de Greenhouse 
e Geisser, Corre$ao de Huynh- 
Feldt, Estimativa Limite Inferior e 
Teste de Mauchly 
Espermatozoide 

Codoma Japonesa 44-45, 269- 
271 

Humano 340-341,490-503 
Estatfstica de Verossimilhan 9 a Log 
223-225, 235-238, 242-243, 250- 
251,254-255,641-665 
Estatfstica de Wald 225-227, 234- 
235, 242-243, 246-247, 251, 254, 
641-665 

Estatfstica do Escore Eficiente de 
Rao 227, 234-236, 641-665 
Estatfstica do Escore veja Estatfsti¬ 
ca do Escore Eficiente de Rao 
Estatfstica Passo (Step) 237-238 
Estatfstica Qui-Quadrado 234-237, 
240-243, 509-510, 606-623, 628- 
629, 631-632, 635-637, 641-665 
Estatfstica Qui-Quadrado do Mo- 
delo 236-238, 247-248, 250-251, 
254-255 

Estatfstica Studentizados 199-200 
Estatfsticas Condicionais 227 
Estimador nao viciado 179-180, 
veja tambem Estimador nao ten- 
dencioso 

Estimativa da Variancia Agrupada 
288-289 

Estimativa de Maxima Veros- 
similhanga 223-224, 608-609, 
641-665 

Eta ao quadrado 337-338, 347- 
348, 360-361, 386-387, 641-665 
Exp b 226-227, 232-233, 239-256, 
641-665 

Extra ? ao 564-567, 573-575, 580- 
583, 587, 641-665, veja tambem 
Criterio de Kaiser 

F 

F de Welch 328-333, 641-665 
Fator 364, 526, 553-559, 641-665, 
veja tambem Analise de Fatores, 
Variavel Independente, Variavel 
latente 


Fator de Infla^ao da Variancia 183- 
184, 187-188, 201-203, 256-258, 
641-665 

Fatora^ao Alfa de Kaiser 561-563, 
641-665 

Fatora^ao da imagem 561-562 
Fatora^ao pelo Eixo Principal 
561-562 

Fi ou Phi 612-613, 616, 641-665 
F1V (Fator de lnfla 5 ao da Varian¬ 
cia) 

Formula de Stein 180-181, 194- 
195 

G 

X de Goodman e Kruskal 612-613, 
641-665 

Generaliza$ao 178, 641-665 
Gradiente 156-159, 172-173, 221- 
222, 293-294 

Grafico de Barras de Erro 119-123 
Grafico de Dispersao versus de 
Nfvel 347-349 

Grafico de Linhas 87-88, 378-380, 
382-385 

Graficos de Intera£ao 372-373, 
382-387, 422-426, 641-665 
Graficos de Probabilidade Normal 
189-190, 207-212 
Graficos no SPSS 86-92 
Graficos Interativos 119-123 
Plotar a mediana 120 
Plotar a moda 120 
Plotar a Variancia 120 
Plotar o Desvio Padrao 120 
Graficos P-P veja Graficos de Pro¬ 
babilidade Normal 
Graficos Q-Q ou Diagrama Quan- 
til-Quantil 114-116 
Graus de Liberdade 163-166, 196- 
197, 199-200, 236-237, 284, 286- 
289, 292, 305-310, 339, 350-351, 
360-362, 366-370, 388-390, 397- 
398, 401-404, 409-411,416-417, 
437-438, 493, 607-609, 641-665 
GT2 de Hochberg 323-324, 337- 
338 

H 

H veja SSCP 
HE 1 veja SSCP 

Heterocedasticidade 178-179, 188- 
189, 207-212, 641-665 


Heterogeneidade da Variancia veja 
Homogeneidade da Variancia 
Hipotese de SSCP ( H) veja SSCP 
Hipotese Experimental 49-50, 280, 
641-665 

Hipotese Nula 49-50, 278-280, 
287-288,641-665 
Hipoteses dos testes parametricos 
85-87, 309-310, 474 
Histograma veja Distribu^ao das 
Frequencias 

Homocedasticidade 641-665 
Homogeneidade da Inclina$ao da 
Regressao 357-361, 641-665 
Homogeneidade da Matriz de 
Covariancia 529-531. 534-536, 
641-665 

Homogeneidade da Variancia 85- 
86, 116-120, 280, 290-292, 295, 
309-310, 322-324, 328-333, 337- 
338, 347-350, 374-375, 395-396, 
407-408,447-448, 450, 478-479, 
490-491,493-495, 529-530, 641- 
665 

Homogeneidade Secundaria 486- 
488 

I 

Independencia 85-87, 178-179, 
280, 395-396, 529-530, 641-665 
Indice de Cond^ao 183-184, 187- 
188,202-204, 257-258 
Influencia ou ponto de influencia 
174, 189-191, 205-208, 244, 246- 
247, 641-665 

lntera?ao 228-230, 359-360, 364- 
365, 368-369, 376-380, 382-387, 
430-437,490,454-471,514, 
641-665 

Interceptar 156-158, 172-173, 
221-222, 232-233,293-295 
Intervalo Interquartflico 96, 99, 
641-665 

Intervalos de Confian 5 a 44-47, 
187, 197-198, 200-201,232- 
233, 239-241,251,254-256, 
269-271,285-286, 327-330, 
334-336, 352, 378-380, 540- 
542, 641-665 

Intervalos de Confian^a Simulta- 
neos de Roy-Bose 405-406 
Inversa (de uma matriz) 525-526 
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K 

T de Kendall veja Correla^ao 
KMO veja Medida de adequa^o 
da Amostra de Kaiser-Meyer- 
Olkin 

L 

Lambda de Wilk 529-531, 536, 
545-546, 641-665 
Lei da Soma das Variancias 288, 
641-665 

Leptocurtica 641-665, veja Cur- 
tose 

Lesbicas budistas 261 
Limite Inferior da Estimativa 397- 
398,409-410,641-665 
Linearidade (Suposi§ao de) 178- 
179, 207-212, 222-223 
Linha de Regressao veja Regres¬ 
sao 

Linha do MelhorAjuste 158-160, 
163-165 

M 

Maior Raiz de Roy 529-531, 536, 
641-665 

MANOVA 324-325, 328, 398-399, 
412, 514-552, 563-564, 641-665 
Matriz 517-518, 641-665 
Matriz anti-imagem 572-573, 579- 
581,577-579 

Matriz da Soma dos Quadrados e 
do Produto Cruzado veja SSCP 
Matriz das Variancias-Covarian- 
cias 183-184, 187, 530-531, 538- 
540, 563-564, 593-595, 641-665 
Matriz de Componentes 557-558, 
641-665, veja tambem Matriz Pa¬ 
drao, Matriz Estrutural 
Matriz de Correla$ao 141-142, 

187, 191-193, 202-204, 232-233, 
538-540, 553-554, 564, 571-574, 
577-580, 583, 587 
Matriz de identidade 518, 533- 
534, 539-540, 571-573, 580-581, 
590-592, 641-665 
Matriz de Transforma§ao 412-414, 
422-423, 426 

Matriz de Transforma^ao dos Fa- 
tores 567-568, 589, 641-665 
Matriz do Diagrama de Dispersao 
135-138 


Matriz dos Fatores 557-558, 
641-665, veja tambem Matriz 
Estrutural 

Matriz Estrutural 557-559, 589, 
591-592, 641-665, veja Matriz 
Padrao 

Matriz Padrao 557-559, 589-591, 
641-665, veja tambem Matriz 
Estrutural 

Matriz R veja Matriz de Corre¬ 
late 

Matriz Reproduzida 572-573, 583, 
587-586 

Media 33-34, 92-93, 119-123, 
160-161, 187, 223-225, 274-275, 
328-330, 641-665 
Media do Grupo Ajustada 347- 
348, 352, 355-356, 641-665 
Media dos Quadrados 162, 165- 
166, 308-309, 330-333, 361-362, 
369-370, 386-388, 403,409-410, 
641-665 

Entre Grupos (MS B g) 416 

Modelo (MS m ) 162, 166-167, 
196-197, 308-309,403,415- 
416, 520, 521 

Residual (MS r ) 162, 166-167, 
196-197, 308-309,369, 403, 
415-416, 520-521 
Media dos Quadrados do Modelo 
(MS m ) veja Media dos Quadrados 
Media Geral 274-276, 305-306, 
367-368, 641-665 
Media Flarmonica 336-337, 641- 
665 

Mediana 92-93, 96, 99,482-484, 
490-491, 641-665 
Medias ao quadrado entre grupos, 
veja Medias ao quadrado 
Medias dos Quadrados dos Re- 
si'duos (MS r ) veja Medias dos 
Quadrados 

Medida de Adequa^ao da Amostra 
de Kaiser-Meyer-Olkin 570-573, 
577-581, 641-665 
Metodo da Razao das Variancias 
veja ANOVA 

Metodo de Anderson-Rubin 560- 
561, 576-577, 590-592, 641-665 
Metodo de Bartlett (dos escores 
dos fatores) 560-561 
Metodo dos Minimos Quadrados 
156-160, 221-222 


Metodo Monte Carlo 479-481, 
486-488,494-496, 505-506, 570- 

571.641- 665 

Metodos de Regressao 169-173 
MLG veja Modelo linear Geral 
Moda 36-37, 92-93, 120, 184-185, 
641-665 

Modelo da Soma dos Quadrados 
veja tambem Soma dos Erros 
Quadrados 

Modelo do Produto Cruzado 
(CP M ) veja Desvios do Produto 
Cruzado 

Modelo Linear 47-49, 156-159, 
526, 556-557, 641-665, veja tam¬ 
bem Modelo Linear Geral 
Modelo Linear Geral (MLG) 293- 
295, 299-304, 343-344, 352-358, 
388-393,617-624 
Modelo Saturado 621, 623-624, 
628-629, 641-665 
Modelos Customizados 370-372 
Motorhead 116-117 
Mudan 9 a no R 2 187, 193-197, 
215-216 

Multicolinearidade 178-179, 182- 
184, 186-188, 191-192, 197-198, 
200-204, 254-261,553-554, 
560-561, 571-573, 577-579, 593, 
641-665 

Multimodal 107-109, 641-665 

N 

Niveis de Mensura$ao 71-72 
Normalidade dos Erros 178-179, 
210-211 

Normalidade Multivariada 529- 

531.641- 665 

0 

O F de Brown-Forsythe 328-333, 
641-665 

Omega ao Quadrado 338, 347- 
348, 360-361, 386-388, 415-416, 
437, 641-665 
Ordenada 129-130 
Ortogonal 641-665 

P 

Padroniza^ao 135-136, 174, 281 - 

283.641- 665 
Parcializar 343-344 
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Passo a Passo para Frente 170-171, 
227-228, 233-235 
Platicurtica 641-665, veja Curtose 
Poder 57-59, 180-181, 293-294, 
322-323, 347-348, 395-399,405- 
407,412, 434-435,483-501, 514- 
517, 530-531, 534-538, 609-610, 

625.641- 665 

Ponderafoes veja Pesos 314-317, 
641-665 

Popula 5 ao 32-33, 641-665 
Postos 144-145, 475-477, 484- 
485,491-493,504-505 
Postos empatados 476-477 
Previsao de membro de grupo 231, 
242-243 

Probabilidade 226-227, 239-240, 
242-243, 641-665 
Probabilidades Previstas 231, 
242-243 

Problema da Terceira Variavel 143, 
178-179 

Produto Cruzado Total (CP T ) veja 
Desvios do Produto Cruzado 
Proporfao da Variancia 117-118, 
348-350, 641-665 

Q 

Q de Cochran 506-507, 597-598, 
641-665 

Q de Ryan, Einot, Gabriel e Welsh 
veja REGWQ 
Quartil 96, 99 

R 

r de Pearson 641-665, veja Cor- 
rela^ao 

R Multiple 169-170, 182-183, 

187, 193-194, 224-225, 562-563, 
641-665 

R 2 (na regressao logfstica) 223- 
225, 238-239, 246-247, 251, 254 
R 2 143-145, 147-148, 160-162, 
165-166, 169-170, 187, 190-191, 
193-197, 212, 215-216, 223-225, 
238-239, 246-247, 251, 254, 337- 
338, 347-348, 353-354, 360-361, 
386-387 

R 2 Ajustado 179-181, 187, 193- 

195.641- 665 

R 2 de Cox e Snell 225, 238-239, 
247-248, 641-665 


R 2 de Hosmer e Lemeshow 225, 
238,247-248,641-665 
R 2 de Nagelkerke 225, 239, 247- 
248, 641-665 

Razao da Verossimilhanfa 227, 
234-235, 240-241, 608-609, 615- 
616, 624-625, 628-629, 631-633, 
637-638,641-665 
Razao de chances 616-618, 636- 
638, 641-665 

Razao de Covariancias 176-178, 
189-191,206-208,641-665 
Razao F162, 165-166, 187, 194- 
196, 237-238, 299-301, 303-306, 
308-311, 329, 332-333, 339, 361- 
362, 369-370, 388-390, 397-400, 
403-406, 409-414, 437-438, 448, 
450-452, 454-456, 455-462, 464- 
467, 469-471, 520-521, 526, 528- 
530, 536-538, 641-665 
Razoes de Variancias 187-188, 
202, 258 

Rea 9 oes Extremas de Moses 479- 

481,641-665 

Regressao 131-132, 156-220, 607- 
608,620-621,641-665 
Coeficientes da Regressao 157- 
158, 166-168, 197-202, 212, 
216-218,225-226, 237-238, 
242-243, 246-247, 258, 293- 
295, 347-358, 389-393, 526- 
527,543-547,557-559,641- 
665, veja tambem Coeficientes 
da Regressao Padronizados 
Hipoteses 178-180 
Interagoes 389-393 
Linha de Regressao 158-159, 
357-359 

Regressao Hierarquica 153, 
170-171, 183-184, 193-194, 
196-198, 201-202, 212, 237- 
238,248-256, 343-344,641- 
665 

Regressao Multipla 168-219, 
221-223,246-247, 343-344, 
388-389,526,617-618, 623- 
624, 641-665 

Regressao passo a passo 170- 
172, 201-202, 227-230,641- 
665 

Regressao passo a passo para 
tras 171-172, 227-228 
Tamanho da Amostra 180-183 


Usando o Modelo 167-168 
Regressao Hierarquica veja Re¬ 
gressao 

Regressao Logfstica 221-264, 542- 
543, 606, 641-665, veja tambem 
Regressao 

Regressao Multipla veja Regressao 
Regressao passo a passo (Stepwise 
Backwards), veja Regressao 
REGWQ 322-324, 327-328, 336- 
338, 380-381,383 
Resi'duos 158-159,172-174, 188- 
189, 204-209, 231-233, 243-247, 
532-533, 572-573, 583, 587-586, 
641-665, veja tambem Resfduos 
Padronizados 

Resfduos eliminados 174-175, 
188-191,641-665 
Resfduos Eliminados Studentiza- 
dos 174, 188-191, 641-665 
Resfduos nao-padronizados 641 - 
665, veja Resfduos 
Resfduos Padronizados 173-174, 
187-191,207-209, 232-233, 
243-244, 246-247, 641-665, veja 
tambem Resfduos 
Resfduos Produto-Cruzado (CP R ) 
veja Desvios do produto-crazado 
Resfduos Studentizados 174, 188- 
191, 243, 641-665 
Rota9ao 558-559, 565-570, 574- 
576, 587-592, 641-665 
Rota 9 ao Oblfqua 558-559, 
566-568, 575-576, 589-592, 
641-665, veja tambem Rota 9 ao 
Oblimirt Direta, Rota 9 ao Pro¬ 
max 

Rota 9 ao Ortogonal 558-559, 
566-568, 574-575, 587-589, 
591-592, 641-665, veja 
tambem Rota 9 ao Equamax, 
Rota 9 ao Quartimax, Rota 9 ao 
Varimax 

Rota 9 ao do Fator veja Rota 9 ao 
Rota 9 ao Equamax 567-568, 641- 
665 

Rota 9 ao Oblimin Direta 567-569, 
575-577,589-592, 641-665 
Rota 9 ao Oblfqua veja Rota 9 ao 
Rota 9 ao Ortogonal veja Rota 9 ao 
Rota 9 ao Promax 567-568, 575- 
576, 641-665 
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Rota§ao Quartimax 567-569, 
641-665 

Rota§ao Quartimax Direta 568- 
569 

Rota$ao Varimax 567-569, 575- 
576, 587-589, 641-665 

s 

p de Spearman veja Correlagdo 
Separa^ao Completa 261-262, 
641-665 

Significancia 51-53 
Simetria Composta 395-396, 641- 
665 

Singularidade 571-572, 577-579 
Soma dos Erros ao Quadrado (SS) 
34-35, 158-160, 165-166, 169- 
170, 607-608,641-665 
Modelo da Soma dos Quadrados 
(SS M ) 160-161, 169-170, 196- 
197, 306-308,310-312, 329 
-332, 343-344, 347-350, 353- 
354, 360-361,365-367, 399- 
403,409-410,518-520,523, 
525-530,537-538,641-665 
Soma dos Quadrados Residual 
(SS R ) 160-161, 169-170, 196- 
197, 223-224, 307-308,310- 
312,329, 332-333,343-344, 
347-350, 353-354, 360-361, 
365-366, 368-369, 399-403, 
409-410,518-521,523,525- 
527,529-530,537-538,641- 
665 

Soma dos Quadrados Total 
(SS T ) 160-161, 169-170, 305- 
306,311-312, 347-350, 353- 
354,360-361,365-367, 399- 
401,518-520, 523,528-529, 
537-538, 641-665 
Somas dos Quadrados Tipo II 
370-372 

Somas dos Quadrados Tipo III 
370-372 

Somas dos Quadrados Tipo IV 
370-372 

SS: Soma dos Quadrados entre 
Participantes (SS W ) 399-403 
Soma dos Quadrados do Tipo II 
veja Soma dos Erros ao Quadrado 
Soma dos Quadrados do Tipo III 
veja Soma dos Erros ao Quadrado 


Soma dos Quadrados do Tipo IV 
veja Soma dos Erros ao Quadrado 
Soma dos Quadrados Residual 
(SS R ) veja Soma dos Erros ao 
Quadrado 

Soma Total dos Quadrados (CP R ) 
veja Soma dos Erros ao Quadrado 
SPSS veja tambem Graficos no 
SPSS 

Abrir arquivos 81-83 
Comando: compute (calcular) 
97-98, 100-105, 274-278, 595- 
597 

Comando: descriptives (descriti- 
vas) 97, 99, 275-276 
Comando: explore (explorar) 
113-119 

Comando: frequencies (frequen¬ 
ces) 91-93, 107-110 
Comando: recode (recodificar) 
97-98, 214-216 
Comando: split file (dividir ar¬ 
quivos) 106-114,486-487 
Comando: weight cases (ponde- 
rar casos) 611-612 
Comandoxase summaries (re- 
sumos de casos) 204-207, 242- 
243, 592 

Editor de Dados 61-77 
Entrar Dados 68-69 
Imprimir 78-80 
Iniciar 59-63 

Janela de Sintaxe 80-81, 641 - 
665 

Menus 101-104 
Salvar Arquivos 80-82 
Visualizador 61-62, 76-80, 641- 
665 

Visualizador de Dados 63-64 
Visualizador de Variaveis 63-64, 
69-72, 641-665 

SS veja Soma dos Erros ao Qua¬ 
drado 

SSCP 407-408, 523, 533-534, 
537-540, 563-564, 641-665 
E 1 526 

Erro do SSCP 518-519, 524- 
528,533-534,538-540,641- 
665 

HE 1 526-528, 545-546, 641- 
665 

Hipoteses SSCP 518-519, 524- 
528,538-540,641-665 


SSCP Total 518-519, 523, 525- 

528,641-665 

SS M veja Soma dos Erros ao Qua¬ 
drado 

SS R veja Soma dos Erros ao Qua¬ 
drado 

SS T veja Soma dos Erros ao Qua¬ 
drado 

SS W veja Soma dos Erros ao Qua¬ 
drado 

T 

T veja SSCP 

T 2 de Hotelling 398-399, 529, 531, 
534-536, 598, 641-665 
T2 de Tamhane 323-324 
T3 de Dunnet 323-324 
Tabela de Contingencia 233-235, 
606-607, 609-610, 612-613, 625- 

626.641- 665 

Tabula^ao Cruzada 235-236, 260- 
261, 611-613, 625-626, veja tam¬ 
bem Tabela de Contingencia 
Tamanho de Efeito 56-58, 153- 
154, 180-181, 285-286, 292-293, 
337-338, 347-348, 360-361, 386- 
388,412, 415-416,467-468, 482- 
484,490, 501-503, 509-512, 515- 
516,616-618,636-638,641-665 
Taxa de Erro de Conjunto 298- 
299, 310-311, 322-323, 514-515, 
641-665, veja tambem Taxa do 
Erro Experimental 
Taxa de Erro Experimental 298- 

299.641- 665 

Tendencia Cubica 320-322, 641- 
665 

Tendencia Linear 320-322, 330- 
333, 339 

Tendencia Quadratica 320-322, 
330-333, 641-665 
Tendencia Quartica 320-322, 641- 
665 

Tertium Quid (terceira coisa) veja 
Problema da Terceira Variavel 
Testando Hipoteses 47-51, 53-54, 
141-142, 271 

Teste bilateral 53-56, 138-141, 

145, 285, 292, 310-311, 327-328, 
333-336,477-478, 641-665, veja 
tambem Teste unilateral 
Teste da mediana 495-496, 506- 
507, 641-665 
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Teste da Soma dos postos de Wil- 
coxon 295,475-485,491-492, 
641-665 

Teste de Box 530-531, 534-536, 
543-544, 641-665 
Teste de Dunn 322-323 
Teste de Dunnet 327-328, 334-338 
Teste de Durbin-Watson 178-179, 
186-188, 193-197, 207-208, 641- 
665 

Teste de Esfericidade de Bartlett 
533-536, 539-540, 571-573, 577- 

581.641- 665 

Teste de Jonckheere-Terpstra 494- 
496,499-502, 641-665 
Teste de Kolmogorov-Smirnov 
112-117, 210-211, 477-479,493- 
495, 505-506, 641-665 
Teste de Kruskal-'Wallis 339-340, 
490-505,641-665 
Teste de Levene 117-120, 280- 
281,291-293, 328, 330-334, 
337-338, 347-350, 374-376, 
447-448, 450-451, 478-481,493- 
495, 530-531, 536-538, 641-665, 
veja tambem Homogeneidade da 
Variancia 

Teste de Mann-Whitney 295, 475- 
485,491-492, 498-500, 641-665 
Teste de Mauchly 396-398, 408- 
410,426-427, 438-439, 447-448, 

450.641- 665 

Teste de McNemar 486-488, 641- 
665 

Teste de Newman-Keuls 322-323 
Teste de Scheffe 322-323 
Teste de Shapiro-Wilk 112-113, 
477-479, 493-495, 505-506, 641- 
665 

Teste dos postos com sinais de 
Wilcoxon 295, 484-491, 641-665 
Teste Estatlstico 51 -54, 641 -665 
Teste Multivariado 514, 641-665 
Teste post hoc de Gabriel 323-324, 
327-328, 337-338 
Teste post hoc de Games-Howell 
323-324, 327-328, 334-338, 380- 
381,383 

Tester 140-141, 146-148, 162- 
165, 167-168, 171-172, 197, 
199-202, 217-218, 225-226, 268- 
271, 278-284, 298-300, 308-311, 
316-317, 323-324, 328, 333-334, 


338, 343-344, 350-351, 355-358, 
360-361,618-619, 641-665 
Teste t Dependente 280-287, 
406-407,484-485,641-665 
Teste t Independente 287-293, 

475,641-665 

Teste t de amostras pareadas veja 
teste t Dependente 
Teste f dependente 641-665, veja 
teste t 

Teste t emparelhado veja teste f 
dependente 

Teste t independente 641-665, veja 
teste t 

Teste t Relacionado veja Teste t 
Dependente 

Teste Unilateral 53-56, 138-141, 
145, 153-154,284, 286-287, 
292-293, 310-311, 327-328, 333- 
336, 641-665, veja tambem Teste 
Bilateral 

Teste univariado 514, 641-665 
Testes Nao-parametricos 106-107, 
144-146, 295, 474-513, 641-665 
Testes Parametricos 85, 641-665 
Testes post hoc 310-311, 313- 
314, 322-324, 327-328, 334-338, 
345-348, 405-408, 352, 373-374, 
379-381, 383, 413-415,422-423, 
426-434, 446-447,496-500, 508- 
510,533-534, 641-665 
Tolerancia 183-184, 187-188, 201- 
203, 256-258, 641-665 
Tra 50 de Pillai-Bartlett 528-531, 
536, 641-665 

Transforma^ao de Dados 98-107, 
118-119, 330-332,448, 450-451, 
95-96, veja tambem Transfor- 
ma$ao Log, Transforma^ao Re- 
clproca, Transforma^ao da Raiz 
Quadrada 

Transforma^ao Inversa 100-101, 
103-104 

Transforma^ao Log 100-101, 103- 
104, 118-120, 222-223, 347-349, 
619 

Transforma^ao pela Raiz Quadra¬ 
da 100-101, 103-104, 330-332, 
376 

V 

V de Cramer 612-613, 616, 641- 
665 


Valida ? ao Cruzada 179-181, 641- 
665 

Valor Atlpico ou valor discrepante 
88-89,95-99, 129-134, 172-174, 
176-178, 188-189, 207-208, 210- 

212,641-665 

Lidando com valores atfpicos 
98-107 

Valor Chapeu 641-665 veja In- 
fluencia ou ponto de influencia 
Valores Esperados 607-610, 612- 
615,621-625 

Valores omissos ou faltantes 75-76 
Valores previstos ajustados 174, 
188-191,641-665 
Valores Previstos Padronizados 
188-191,208-209 
Varia^ao Amostral 42 
Varia^ao nao-sistematica 51, 53- 
54, 266-269, 281-283, 293-294, 
308-309, 330-333, 395-396,403, 
525-526, 529, 641-665, veja tam¬ 
bem Varia^ao Sistematica 
Varia^ao Sistematica 51, 53-54, 
266-269, 281-282, 308-309, 403, 

525- 526, 641-665, veja tambem 
Varia^ao nao-sistematica 
Variancia 35-40, 92-93, 120, 125- 

126, 305-306, 308, 366-367, 538- 
540, 641-665 

Variancia Aleatoria 562-563, 641 - 
665 

Variancia Comum 562-563, 582- 
583, 641-665 

Variancia Unica 148-149, 151, 
182-183,562-563,641-665 
Variates Fumjao Discriminante 

526- 530, 543-548, 564, 641-665, 
veja CL (Combinagao Linear) 
Variates veja Variates da fun^ao 
discriminante e Combinagao 
Linear 

Variaveis Auxiliares (Dummy) 
212-215,230-231,294-295, 
300-304, 314-317, 343-344, 348- 
350, 356-358, 389-390, 618-623, 
641-665 

Variavel Categorica 606, 641-665 
Variavel Codigo 71-74, 271 
Variavel Contlnua 145-148 
Variavel de Confusao ou Interve- 
niente 269-270, 343-344, 348- 
350, 641-665 
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Variavel Dependente 156-157, 
184-185, 266,641-665 
Variavel Dicotomica 145-146, 
641-665 

Variavel Discreta 145-148 
Variavel Independente 156-157, 
184-185, 266, 641-665, veja tam¬ 
bem Variavel Previsora 
Variavel Latente 526, 553-554, 
561-562, 569-570, 641-665, veja 
tambem Fator 


Variavel Numerica 74-75 
Variavel Previsora 156-157, 641- 
665 

Variavel texto 74-75, 641-665 
Vetor 202-203, veja tambem Vetor 
Coluna, Vetor Linha 
Vetor Coluna 518 
Vetor Linha 518 

Visualizador 641-665, veja SPSS 
Visualizador de Variaveis 641-665, 
veja SPSS 


w 

IV de Kendall 506-507, 641-665 
WSD de Tukey 405-407 

z 

Z de Kolmogorov-Smirnov 479- 
481,641-665 












































































































